我用谷歌搜索的东西没有用,所以我求助于专家!
我在制表符分隔的文本文件中有一些文本,其中包含某种回车符(当我在 Notepad++ 中打开它并使用“显示所有字符”时,我在行尾看到 [CR][LF]) . 我需要删除这个回车(或任何它),但我似乎无法弄清楚。这是文本文件的片段,其中显示了带有回车的行:
firstcolumn secondcolumn third fourth fifth sixth seventh
moreoftheseventh 8th 9th 10th 11th 12th 13th
这是我试图用来替换它的代码,但它没有找到返回:
with open(infile, "r") as f:
for line in f:
if "\n" in line:
line = line.replace("\n", " ")
我的脚本只是没有找到回车。我是否做错了什么或对这个回车做出了错误的假设?我可以在文本编辑器中手动删除它,但文本文件中大约有 5000 条记录也可能包含此问题。
更多信息:这里的目标是从文本文件中选择两列,所以我拆分 \t 字符并将值作为数组的一部分引用。它适用于没有返回的任何行,但在有返回的行上失败,因为例如,这些行中没有元素 9。
vals = line.split("\t")
print(vals[0] + " " + vals[9])
因此,对于上面的文本行,此代码失败,因为该特定数组中没有索引 9。对于没有 [CR][LF] 的文本行,它按预期工作。