关键词

如何在索引上合并两个Pandas数据框架

要合并两个Pandas数据框架(dataframe),需要使用Pandas库中的merge函数。这个函数可以根据指定的列将两个数据框架合并为一个。以下是合并数据框架的详细步骤。

准备数据

首先,我们准备两个数据框架,每个数据框架都有一列用作索引(index),而且这两个数据框架包含的索引值有重叠。

import pandas as pd

# 准备第一个数据框架
data1 = {'index': [1, 2, 3, 4],
        'data1': ['a', 'b', 'c', 'd']}
df1 = pd.DataFrame(data1)
df1 = df1.set_index('index')

# 准备第二个数据框架
data2 = {'index': [3, 4, 5, 6],
        'data2': ['e', 'f', 'g', 'h']}
df2 = pd.DataFrame(data2)
df2 = df2.set_index('index')

现在,我们有了两个数据框架df1和df2,每个数据框架都有一列作为索引,两个数据框架的索引值有重叠。

合并数据

我们将使用merge函数合并两个数据框架。merge函数将两个数据框架连接在一起,必须指定要连接的索引列的名称。在本例中,我们将使用‘index’列来连接这两个数据框架。

merged_df = pd.merge(df1, df2, on='index', how='inner')
print(merged_df)

在上面的代码中,我们使用了merge函数合并了df1和df2,指定了要连接的索引列的名称为‘index’,how='inner'表示进行内部连接,即只包括重叠的索引值。合并后的结果将保存在merged_df变量中,我们使用print函数输出merged_df的结果,如下所示:

      data1 data2
index           
3        c    e
4        d    f

可以看到,它只包含了索引值为3和4的两行数据,这是因为这两个索引值是两个数据框架共有的。data1和data2分别是原始数据框架df1和df2的列名。

结论

在本教程中,我们学习了如何使用merge函数将两个Pandas数据框架合并为一个。它需要指定要连接的索引列名,可以使用inner、outer、left或right连接类型。merge函数非常灵活,允许在合并数据框架时进行更多的控制,可以更好地满足不同的需求。

本文链接:http://task.lmcjl.com/news/17501.html

展开阅读全文