关键词

详解pandas.DataFrame.cov()(计算数据框协方差)函数使用方法

作用介绍

pandas.DataFrame.cov()是pandas.DataFrame类中的一个方法,用于计算DataFrame数据集中各列之间的协方差矩阵。

协方差矩阵是用于衡量两个随机变量之间相关性的一个指标,其值越大表示两个变量相关性越强,其值为负则表示两个变量呈反相关性。

使用方法

pandas.DataFrame.cov()方法的语法为:

DataFrame.cov(min_periods=None)

该方法可以接收一个min_periods参数,表示计算协方差时至少需要数据的个数,若数据个数小于该值,则返回NaN值。

下面演示两个实例:

实例1

import pandas as pd

data = {
    'A': [1, 2, 3, 4, 5],
    'B': [5, 4, 3, 2, 1],
    'C': [6, 7, 8, 9, 10]
}

df = pd.DataFrame(data)

print(df.cov())

运行结果如下:

          A         B         C
A  2.500000 -2.500000  2.500000
B -2.500000  2.500000 -2.500000
C  2.500000 -2.500000  2.500000

协方差矩阵的结果显示变量A与C之间呈正相关性,变量A与B、B与C之间呈反相关性。

实例2

import pandas as pd

data = {
    'A': [1, 2, 3, 4, 5],
    'B': [5, 4, 3, 2, 1],
    'C': [6, 7, 8, 9, 10]
}

df = pd.DataFrame(data)

print(df.cov(min_periods=6))

运行结果如下:

    A   B   C
A NaN NaN NaN
B NaN NaN NaN
C NaN NaN NaN

由于min_periods参数设定为6,而数据集中只有5条数据,因此返回了NaN值。

本文链接:http://task.lmcjl.com/news/17725.html

展开阅读全文