pandas.DataFrame.cov()是pandas.DataFrame类中的一个方法,用于计算DataFrame数据集中各列之间的协方差矩阵。
协方差矩阵是用于衡量两个随机变量之间相关性的一个指标,其值越大表示两个变量相关性越强,其值为负则表示两个变量呈反相关性。
pandas.DataFrame.cov()方法的语法为:
DataFrame.cov(min_periods=None)
该方法可以接收一个min_periods参数,表示计算协方差时至少需要数据的个数,若数据个数小于该值,则返回NaN值。
下面演示两个实例:
import pandas as pd
data = {
'A': [1, 2, 3, 4, 5],
'B': [5, 4, 3, 2, 1],
'C': [6, 7, 8, 9, 10]
}
df = pd.DataFrame(data)
print(df.cov())
运行结果如下:
A B C
A 2.500000 -2.500000 2.500000
B -2.500000 2.500000 -2.500000
C 2.500000 -2.500000 2.500000
协方差矩阵的结果显示变量A与C之间呈正相关性,变量A与B、B与C之间呈反相关性。
import pandas as pd
data = {
'A': [1, 2, 3, 4, 5],
'B': [5, 4, 3, 2, 1],
'C': [6, 7, 8, 9, 10]
}
df = pd.DataFrame(data)
print(df.cov(min_periods=6))
运行结果如下:
A B C
A NaN NaN NaN
B NaN NaN NaN
C NaN NaN NaN
由于min_periods参数设定为6,而数据集中只有5条数据,因此返回了NaN值。
本文链接:http://task.lmcjl.com/news/17725.html