关键词

如何在Python中把Sklearn数据集转换成Pandas数据框

将sklearn数据集转换成pandas数据框的过程相对简单,可以按照以下步骤进行:

  1. 导入所需的库和数据集
from sklearn import datasets
import pandas as pd

在此示例中,我们使用iris数据集。

iris = datasets.load_iris()
  1. 创建数据框

将用于创建数据框的数据分离出来,并建立一个列表。

data = iris.data
features = iris.feature_names

df = pd.DataFrame(data, columns=features)

这些步骤后,我们将得到以下数据框:

sepal length (cm) sepal width (cm) petal length (cm) petal width (cm)
0 5.1 3.5 1.4 0.2
1 4.9 3.0 1.4 0.2
2 4.7 3.2 1.3 0.2
3 4.6 3.1 1.5 0.2
4 5.0 3.6 1.4 0.2

其中,每个样本作为行,每个特征作为列。

完整代码如下:(可供实际运行)

from sklearn import datasets
import pandas as pd

# 导入数据集
iris = datasets.load_iris()

# 创建数据框
data = iris.data
features = iris.feature_names

df = pd.DataFrame(data, columns=features)

print(df.head())

输出结果:

   sepal length (cm)  sepal width (cm)  petal length (cm)  petal width (cm)
0                5.1               3.5                1.4               0.2
1                4.9               3.0                1.4               0.2
2                4.7               3.2                1.3               0.2
3                4.6               3.1                1.5               0.2
4                5.0               3.6                1.4               0.2

本文链接:http://task.lmcjl.com/news/14444.html

展开阅读全文