0
negids = movie_reviews.fileids('neg')
posids = movie_reviews.fileids('pos')

for f in negids:
  with open(fileids=[f], "rb") as infile, open(fileids=[f], 'wb') as outfile:
  in_txt = csv.reader(infile, delimiter = '\t')
  out_csv = csv.writer(outfile)
  out_csv.writerow(in_txt)

谁能帮忙我正在尝试读取电影评论语料库的 neg 文件夹中的每个文件,并希望将该文件的完整数据作为一行插入到 Excel 表中

4

2 回答 2

0

使用 csv DictReader。

import csv
import json
data = csv.DictReader(open('filename.csv', 'r'))
print data.fieldnames
for each in data:
   row ={}
   # check condition code here
   output.append(row)
print output 

将输出数据添加到 csv 文件中

于 2013-11-07T09:34:30.373 回答
0
directory = raw_input("INPUT Folder:")
output = raw_input("OUTPUT Folder:")

txt_files = os.path.join(directory, '*.txt')

for txt_file in glob.glob(txt_files):
with open(txt_file, "rb") as input_file:
    in_txt = csv.reader(input_file)
    filename = os.path.splitext(os.path.basename(txt_file))[0] + '.csv'

    with open("book.csv", 'wb') as output_file:
        out_csv = csv.writer(output_file)
        out_csv.writerows(in_txt)

我已经尝试过这段代码它正在工作,但问题是电影评论语料库的 neg 文件夹中的每个文本文件必须作为 csv 文件中的一行(即 neg 文件夹包含数千个文件,我希望新创建的 csv对于一个文本文件的完整文本,一行应该有一千行),但这没有发生最后一个文件数据覆盖以前的文件数据,最后一个文件数据出现在 csv 文件的多行中

于 2013-11-07T10:00:29.070 回答