关键词

从Pandas数据框架中删除列中有缺失值或NaN的行

Pandas中,我们可以使用dropna()方法来从数据框架中删除具有缺失值或NaN值的行或列。

为了删除列中有缺失值或NaN的行,我们需要在dropna()方法中指定轴向参数axis=0。此外,我们还需要指定subset参数以确定要处理的列。

以下是完整的过程及示例代码:

  1. 导入Pandas库并读入数据:
import pandas as pd

df = pd.read_csv('data.csv')
  1. 检查数据表中的缺失值:
print(df.isnull().sum())

此代码将输出每列中的缺失值数目。

  1. 删除具有缺失值的行:
df = df.dropna(axis=0, subset=['column_name'])

其中,column_name是包含缺失值的列的名称。

以下是示例代码:

import pandas as pd

# 读入数据
df = pd.read_csv('data.csv')

# 检查数据表中的缺失值
print(df.isnull().sum())

# 删除具有缺失值的行
df = df.dropna(axis=0, subset=['column_name'])

请注意,dropna()方法将返回一个新的数据框架,因此我们需要将其赋值给一个变量以存储修改后的数据。

最后,我们可以使用to_csv()方法将处理后的数据保存到新的CSV文件中:

# 保存处理后的数据到新文件
df.to_csv('clean_data.csv', index=False)

本文链接:http://task.lmcjl.com/news/14543.html

展开阅读全文