Pandas DataFrame.describe()函数详解:计算数据统计信息

Pandas DataFrame.describe()函数是一个非常有用的函数,它可以根据数据的类型,计算出数据的统计信息,包括数据的均值、标准差、最小值、最大值、中位数、四分位数等。

使用方法

使用Pandas DataFrame.describe()函数,需要先导入Pandas库,例如:

import pandas as pd

创建一个DataFrame,例如:

data = {'name':['Tom', 'Jack', 'Steve', 'Ricky'],'age':[28,34,29,42]}
df = pd.DataFrame(data, columns=['name','age'])

调用Pandas DataFrame.describe()函数,可以获得数据的统计信息:

df.describe()

输出如下:

        age
count   4.000000
mean    33.500000
std     8.506061
min     28.000000
25%     28.750000
50%     32.500000
75%     38.250000
max     42.000000

从输出结果可以看出,数据的均值为33.5,标准差为8.506,最小值为28,最大值为42,中位数为32.5,四分位数分别为28.75、38.25。

Pandas DataFrame.describe()函数可以让我们快速地获得数据的统计信息,从而更好地理解数据的分布情况,从而更好地分析数据。

本文链接:http://task.lmcjl.com/news/2189.html

展开阅读全文