1

需要一些帮助!对不起,如果这听起来很愚蠢。我是 python 新手,想试试这个例子....

但是如果我有两个 .txt 文件(pos 和 neg)每个都有 1000 条推文,那么标签是手动制作的。

使用上面的示例如何将它与文本文件一起使用?

4

2 回答 2

3

如果我理解正确,您需要找出一种将文本文件读入 Python 对象的方法。

考虑到您有两个文本文件,其中包含正样本和负样本 (pos.txtneg.txt),每行一条推文:

train_samples = {}

with file('pos.txt', 'rt') as f:
    for line in f.readlines():
        train_samples[line] = 'pos'

对负面推文重复上述循环,您就完成了填充train_samples.

于 2012-10-16T13:16:14.013 回答
0

您应该从 numpy 包中查找 genfromtxt 函数:http: //docs.scipy.org/doc/numpy/user/basics.io.genfromtxt.html

它返回一个矩阵,给定正确的参数(分隔符、换行符、...)

于 2012-10-16T13:19:39.340 回答