csv - 在 Python CSV 模块中将分隔符更改为 CTRL+A

Question

我正在尝试使用分隔符 ctrl+a 编写一个 csv 文件。我最终将不得不将文件写入hadoop，并且我无法使用标准分隔符。

目前我正在尝试这个：

writer = csv.writer(f, delimiter = "\u0001")
for item in aList:
     writer.writerow(item)

f.close()

但是，输出的 excel 文件似乎没有正确写入......有些行被压缩到一个块中，而另一些行将在第一个中包含一个字段，然后将其余部分压缩到第二个块中，等等。

是我设置编写器对象的错误，还是我不熟悉以这种方式分离文件？

score 0 · Accepted Answer

您可以尝试使用非打印“组分隔符”字符，它可以在 python 代码中表示为 '\035'

如果您需要更多其他非打印字符，请参阅http://www.asciitable.com/index/asciifull.gif 。

包含更多关于为什么要使用非标准分隔符的上下文可能会有所帮助。以及是否需要对文件进行 Excel 解析，或者只是快速检查文件是否可以被目标系统 Hadoop 正确解析。

1 回答 1