在 Pandas 数据框架中,我们可以使用 value_counts() 方法获取一个列的频率计数。下面是详细的攻略:
在使用 Pandas 的数据框架之前,我们需要导入 Pandas 库。
import pandas as pd
读取待处理的数据集,可以使用 Pandas 中的 read_csv() 方法。我们这里以示例数据集 titanic.csv 为例。
df = pd.read_csv('titanic.csv')
使用 value_counts() 方法获取一个列的频率计数。
freq_counts = df['Embarked'].value_counts()
print(freq_counts)
上面的代码中,我们以 'Embarked' 列为例,使用 value_counts() 方法获取了该列的频率计数,并将结果存储在 freq_counts 变量中。然后使用 print() 函数打印了结果。在这个例子中,我们获取了 'Embarked' 列的频率计数,可以看到结果中包含有不同取值的频数,以及这些频数所对应的取值。
value_counts() 方法还可以接受一些可选的参数,来调整计数的方式。
例如,我们可以按照降序排列,并将频数除以总数得到频率。
freq_counts = df['Embarked'].value_counts(normalize=True, sort=True, ascending=False)
print(freq_counts)
在这个例子中,我们使用了 normalize=True 将频数除以总数得到频率,并使用 sort=True, ascending=False 参数按照降序排列。
本文链接:http://task.lmcjl.com/news/17552.html