在Pandas中,我们可以使用dropna()
方法来从数据框架中删除具有缺失值或NaN值的行或列。
为了删除列中有缺失值或NaN的行,我们需要在dropna()
方法中指定轴向参数axis=0
。此外,我们还需要指定subset
参数以确定要处理的列。
以下是完整的过程及示例代码:
import pandas as pd
df = pd.read_csv('data.csv')
print(df.isnull().sum())
此代码将输出每列中的缺失值数目。
df = df.dropna(axis=0, subset=['column_name'])
其中,column_name
是包含缺失值的列的名称。
以下是示例代码:
import pandas as pd
# 读入数据
df = pd.read_csv('data.csv')
# 检查数据表中的缺失值
print(df.isnull().sum())
# 删除具有缺失值的行
df = df.dropna(axis=0, subset=['column_name'])
请注意,dropna()
方法将返回一个新的数据框架,因此我们需要将其赋值给一个变量以存储修改后的数据。
最后,我们可以使用to_csv()
方法将处理后的数据保存到新的CSV文件中:
# 保存处理后的数据到新文件
df.to_csv('clean_data.csv', index=False)
本文链接:http://task.lmcjl.com/news/14543.html