关键词

如何在pandas数据框架中选择多个列

Pandas中选择多个列可以使用方括号来实现,即将需要选择的列名放到方括号中作为一个列表。下面为您提供一份完整的攻略:

1. 选择单个列

我们首先要了解如何选择单个列。假设我们有一个数据框架df,其中包含三列:age、gender和income。代码如下:

import pandas as pd

data = {
    'age': [25, 21, 29, 37, 40],
    'gender': ['M', 'F', 'F', 'M', 'M'],
    'income': [5000, 8000, 6000, 10000, 7000]
}

df = pd.DataFrame(data)

现在我们想要选择其中的一列,比如age列,我们可以使用如下代码:

age = df['age']

这将返回一个名为'age'的Series对象。

2. 选择多个列

要选择多个列,我们可以将需要选择的列名放入一个列表中作为一个参数传递给数据框架的方括号。假设我们现在需要选择age和income列,我们可以使用如下代码:

age_income = df[['age', 'income']]

这将返回一个新的数据框架,其中只包含age和income两列。

3. 选择连续的多个列

如果需要选择连续的多个列,我们可以使用loc方法来实现。假设我们想要选择age、gender和income三列,我们可以使用如下代码:

age_gender_income = df.loc[:, 'age':'income']

这将返回一个新的数据框架,其中包含了age、gender和income三列。

4. 选择列的条件

如果我们需要根据一些条件来选择列,比如选择所有列名包含'age'的列,可以使用str属性和contains方法来实现。代码如下:

age_cols = df.loc[:, df.columns.str.contains('age')]

这将返回一个新的数据框架,其中包含了所有列名包含'age'的列,即age列。

以上就是在pandas数据框架中选择多个列的完整攻略,希望对您有所帮助。

本文链接:http://task.lmcjl.com/news/17254.html

展开阅读全文