关键词

从Pandas数据框架的某一列获取唯一值

获取Pandas数据框架中某一列的唯一值可以使用Pandas库中的unique()方法。下面是详细的攻略流程:

1.首先,导入必要的Python库,包括Pandas和NumPy:

import pandas as pd
import numpy as np

2.加载数据。可以使用read_csv()方法将数据从路径加载到Pandas数据框架中:

data = pd.read_csv('path/to/data.csv')

3.使用unique()方法在特定列上查找唯一值。假设我们希望在列“color”中查找唯一值,可以执行如下代码:

unique_colors = data['color'].unique()
print(unique_colors)

这将输出列“color”中的所有唯一值。

4.您还可以将唯一值存储在另一个Pandas数据表中,然后对其进行排序:

unique_colors = pd.DataFrame(data['color'].unique(), columns=['color'])
unique_colors = unique_colors.sort_values('color')
print(unique_colors)

上述代码将在新数据框架“unique_colors”中存储唯一值,并按“ color”列对其进行排序。

以下是一个完整的示例代码:

import pandas as pd
import numpy as np

# 加载数据集
data = pd.read_csv('path/to/data.csv')

# 查找唯一值
unique_colors = data['color'].unique()
print(unique_colors)


# 存储唯一值
unique_colors = pd.DataFrame(data['color'].unique(), columns=['color'])
unique_colors = unique_colors.sort_values('color')
print(unique_colors)

参考资料:

Pandas官方文档

本文链接:http://task.lmcjl.com/news/17196.html

展开阅读全文