1

我手头的问题有点困难

我有一个相当大的数据库,它以极其复杂的 html 格式存储,但我设法将其转换为更简单、更易于使用的纯文本格式。

格式现在大致如下:

'所有者'  
假车主  
'线'  
FakeOwner 和 FakeRespondant  
'信息'  
这是一条短消息  
'日期'  
2014 年 1 月 28 日星期二 08:49 UTC+11  

然后问题就变成了将其转换为可用的格式,最好是 csv。主要困难在于,对于数据库中包含列的每一行,我无法预测它将出现的顺序。

例如

'所有者'  
安德鲁  
'所有者'  
弥敦道  
'线'  
安德鲁和亚历克斯  
'信息'  
假消息  

但是,我可以说它总是将列的行交替到值,如上所示。(虽然有些“值”只是行尾符号。[\n,不是 \r\n]

示例:
“所有者”
编辑名称
“线程”
编辑名称、编辑名称
“用户”
编辑名称
“日期”
2014 年 1 月 28 日星期二 08:49 UTC+11
“消息”

'用户'
编辑名称
'日期'
2014 年 1 月 28 日星期二 08:50 UTC+11
'消息'
这是一条消息。

4

0 回答 0