1

我正在尝试使用分隔符 ctrl+a 编写一个 csv 文件。我最终将不得不将文件写入hadoop,并且我无法使用标准分隔符。

目前我正在尝试这个:

writer = csv.writer(f, delimiter = "\u0001")
for item in aList:
     writer.writerow(item)

f.close()

但是,输出的 excel 文件似乎没有正确写入......有些行被压缩到一个块中,而另一些行将在第一个中包含一个字段,然后将其余部分压缩到第二个块中,等等。

是我设置编写器对象的错误,还是我不熟悉以这种方式分离文件?

4

1 回答 1

0

您可以尝试使用非打印“组分隔符”字符,它可以在 python 代码中表示为 '\035'

如果您需要更多其他非打印字符,请参阅http://www.asciitable.com/index/asciifull.gif 。

包含更多关于为什么要使用非标准分隔符的上下文可能会有所帮助。以及是否需要对文件进行 Excel 解析,或者只是快速检查文件是否可以被目标系统 Hadoop 正确解析。

于 2013-05-18T21:08:21.490 回答