我需要将 WordPress 中的内容导入基于 Python 的 CMS Plone,并且我使用“;”将帖子表转储为一个巨大的 CSV vanilla 文件。作为分隔符。
问题是来自csv 模块的标准 CSV 阅读器不够智能,无法解析行(post_content
字段)内的 HTML 内容。
例如,当解析器遇到类似的东西时,<p> </p>
它将分号解释为字段分隔符,我最终得到的项目多于字段,并且字段内容错误。
有没有其他选择可以解决此类问题?用正则表达式处理行对我来说似乎很可怕。