将sklearn数据集转换成pandas数据框的过程相对简单,可以按照以下步骤进行:
from sklearn import datasets
import pandas as pd
在此示例中,我们使用iris
数据集。
iris = datasets.load_iris()
将用于创建数据框的数据分离出来,并建立一个列表。
data = iris.data
features = iris.feature_names
df = pd.DataFrame(data, columns=features)
这些步骤后,我们将得到以下数据框:
sepal length (cm) | sepal width (cm) | petal length (cm) | petal width (cm) | |
---|---|---|---|---|
0 | 5.1 | 3.5 | 1.4 | 0.2 |
1 | 4.9 | 3.0 | 1.4 | 0.2 |
2 | 4.7 | 3.2 | 1.3 | 0.2 |
3 | 4.6 | 3.1 | 1.5 | 0.2 |
4 | 5.0 | 3.6 | 1.4 | 0.2 |
其中,每个样本作为行,每个特征作为列。
完整代码如下:(可供实际运行)
from sklearn import datasets
import pandas as pd
# 导入数据集
iris = datasets.load_iris()
# 创建数据框
data = iris.data
features = iris.feature_names
df = pd.DataFrame(data, columns=features)
print(df.head())
输出结果:
sepal length (cm) sepal width (cm) petal length (cm) petal width (cm)
0 5.1 3.5 1.4 0.2
1 4.9 3.0 1.4 0.2
2 4.7 3.2 1.3 0.2
3 4.6 3.1 1.5 0.2
4 5.0 3.6 1.4 0.2
本文链接:http://task.lmcjl.com/news/14444.html