为了显示代码的友好性,我会把代码的每一步运行的结果显示出来,让读者可以有一个直观的认识,了解每一步代码的意思,下面我会先以几条数据为例,让读者可以直观的认识每段代码执行出来的效果,文章末我会已一个大数据集实验,并且给出实验效果,读者可以参考
一、 首先,笔者的数据存放在两个excel,一个是存放的是pos评论,一个是neg评论。分别是poss.xlsx和negg.xlsx,里面的内容如下:
poss.xls的内容是:
neg.xls的内容是:
二、 然后,读入数据了,具体代码如下
import numpy as np import pandas as pd pos = pd.read_excel('poss.xlsx', header=None)#读入数据到pandas数据框架 pos['label'] = 1#添加标签列为1 neg = pd.read_excel('negg.xlsx', header=None) neg['label'] = 0#添加标签列为0 all= pos.append(neg, ignore_index=True)#合并预料
View Code
本文链接:http://task.lmcjl.com/news/12305.html