需要一些帮助!对不起,如果这听起来很愚蠢。我是 python 新手,想试试这个例子....
但是如果我有两个 .txt 文件(pos 和 neg)每个都有 1000 条推文,那么标签是手动制作的。
使用上面的示例如何将它与文本文件一起使用?
如果我理解正确,您需要找出一种将文本文件读入 Python 对象的方法。
考虑到您有两个文本文件,其中包含正样本和负样本 (pos.txt
和neg.txt
),每行一条推文:
train_samples = {}
with file('pos.txt', 'rt') as f:
for line in f.readlines():
train_samples[line] = 'pos'
对负面推文重复上述循环,您就完成了填充train_samples
.
您应该从 numpy 包中查找 genfromtxt 函数:http: //docs.scipy.org/doc/numpy/user/basics.io.genfromtxt.html
它返回一个矩阵,给定正确的参数(分隔符、换行符、...)