我得到了一个 CSV 文件,据说有七列,直到最近我都做得很好,他们开始在第三个数据列中使用逗号,以及在第三列中使用 CR 和 LF 字符,所有这些都在双引号之间.
我正在逐行阅读它,所以我可以用另一个文件交叉检查它,并将它指向另一个文件中的正确行,但是现在它们包含新行代码和逗号,我的代码只是搞砸了.
例如:
1,4778,"El murciélago estaba navegando",10/08/2010,906610,13496-86219-1,1
. 这个运行得很好。1,4778,"El murciélago estaba navegando,
. 现在这很糟糕。
y además estaba de parranda",10/08/2010,906610,13496-86219-1,1
你有什么方法可以解决这个问题吗?第三个数据列总是有这些突然变化的那个。其他人永远不会使用新行或额外的逗号,所以没有必要过滤那些......
提前致谢!