我手头的问题有点困难
我有一个相当大的数据库,它以极其复杂的 html 格式存储,但我设法将其转换为更简单、更易于使用的纯文本格式。
格式现在大致如下:
'所有者' 假车主 '线' FakeOwner 和 FakeRespondant '信息' 这是一条短消息 '日期' 2014 年 1 月 28 日星期二 08:49 UTC+11
然后问题就变成了将其转换为可用的格式,最好是 csv。主要困难在于,对于数据库中包含列的每一行,我无法预测它将出现的顺序。
例如
'所有者' 安德鲁 '所有者' 弥敦道 '线' 安德鲁和亚历克斯 '信息' 假消息
但是,我可以说它总是将列的行交替到值,如上所示。(虽然有些“值”只是行尾符号。[\n,不是 \r\n]
示例:
“所有者”
编辑名称
“线程”
编辑名称、编辑名称
“用户”
编辑名称
“日期”
2014 年 1 月 28 日星期二 08:49 UTC+11
“消息”
'用户'
编辑名称
'日期'
2014 年 1 月 28 日星期二 08:50 UTC+11
'消息'
这是一条消息。