我有一个来自外部的 csv 文件,因此我无法更改其定义或格式,我必须将其读入数据库。
该文件有一些对于 csv 格式看起来很奇怪的东西,我想知道是否有一种方法可以使用 csv.reader 或 pandas 导入它,而无需使用 regex 或类似方法进行一些特定的更正。
该文件使用竖线 (|) 作为分隔符。看看这两个示例行:
1. '11|2000-02-18|Badjora|22|33|44|55|""|""Wood 6.5"" Long Line (Pine - Category:15 m | Humidity max: 13 g/m3)""|4'
2. '333|1999-02-18|Badjora|444|555|666|777|""|"""|4'
有没有办法将其解释为以下字段?
1. 11,2000-02-18,Badjora,22,33,44,55,,"Wood 6.5"" Long Line (Pine - Category:15 m | Humidity max: 13 g/m3)",4
2. 333,1999-02-18,Badjora,444,555,666,777,,",4
诸如“考虑引号之间的所有内容”之类的东西。
我尝试使用不同的导入设置选项,但没有成功。似乎这种格式对 csv 无效。
非常感谢您提前。
问候所有人