1

我用:

Data = np.genfromtxt(filename, delimiter='"\t"', dtype=None, autostrip=True, skip_header=1)

在过程中它给了我提高 ValueError(errmsg)

Line #33 (got 3 columns instead of 27)

但事实并非如此。在该行的文件中,我有所有列!我检查了 - 函数读取那些带有“缺失值”的行,直到某个符号:例如,在第 33 行函数读取这个:

"http://www.savvyeat.com/whole-wheat-chocolate-chai-muffins/"   "2152"  "{""title"":""Whole Wheat Chocolate Chai Muffins Savvy Eats "",""body"":""I think I subconsciously sabotaged myself Two weeks ago I couldn t

如何以其他方式读取 numpy 数组中的文件或以某种方式解决此问题?

4

1 回答 1

1

一旦我们可以看到 CSV 文件的内容,这种问题应该可以很快解决。要调试问题运行:

import itertools as IT
with open(filename, 'rb') as f:
    content = ''.join(IT.islice(f, 50))
    print(repr(content))

并发布输出。这将为我们提供文件的前 50 行。如果有敏感数据,您可以在发布前对其进行编辑;只需留下引号并\t保持原样。

于 2013-08-31T09:46:37.800 回答