关键词

详解pandas.DataFrame.sum()(计算数据框元素总和)函数使用方法

pandas.DataFrame.sum() 是 Pandas 库中的一个函数,用于计算 DataFrame 中每列和每行的总和。

函数语法

DataFrame.sum(axis=None, skipna=None, level=None, numeric_only=None, min_count=0)

参数说明

  • axis:指定要使用操作的轴。默认为 0,即对列进行操作;如果为 1,则对行进行操作;
  • skipna:指定是否忽略 NaN 值。默认为 True,即忽略 NaN 值;
  • level:指定对哪个级别进行操作;
  • numeric_only:指定是否只对数值型的列进行操作;
  • min_count:指定在求和的过程中有效值的最小个数。可防止由于 NaN 值的存在而导致的结果不准确。

现在我们来看两个实例,更好地理解该函数的作用。

实例1:计算 DataFrame 中每列的总和

import pandas as pd
import numpy as np

# 创建一个 DataFrame
df = pd.DataFrame({
   'A': [1, 2, 3],
   'B': [4, np.nan, 6],
   'C': [7, 8, 9]
})

# 计算每列的总和
sum_result = df.sum(axis=0)

print("每列的总和为:\n", sum_result)

运行结果:

每列的总和为:
 A     6.0
B    10.0
C    24.0
dtype: float64

可以看到,该函数将每列的总和计算出来,并且在返回时,用 Series 表示。

实例2:计算 DataFrame 中每行的总和

import pandas as pd
import numpy as np

# 创建一个 DataFrame
df = pd.DataFrame({
   'A': [1, 2, 3],
   'B': [4, np.nan, 6],
   'C': [7, 8, 9]
})

# 计算每行的总和
sum_result = df.sum(axis=1)

print("每行的总和为:\n", sum_result)

运行结果:

每行的总和为:
 0    12.0
1     NaN
2    24.0
dtype: float64

可以看到,该函数将每行的总和计算出来,并且在返回时,用 Series 表示。由于第二行有 NaN 值,因此计算结果为 NaN。

本文链接:http://task.lmcjl.com/news/17698.html

展开阅读全文