我有一个像这样的纯文本表。我需要对结果行进行分组,以便数据在各自的列中一起出现。
我可以在一个空格上拆分字符串(一行),然后我会得到一个数组,如:
["2", "1/47", "M4044", "25:03*", "856", "12:22", "12:41", "17.52", "Some", "Name", "Yo", "Prairie", "Inn", "Harriers", "Runni", "25:03"]
我也可以分成两个空格,这让我很接近,但仍然不一致,正如您在名称中看到的那样:
["2", " 1/47", "M4044", " 25:03*", "856", " 12:22", " 12:41", "17.52 Some Name Yo", "", "", "", "", "", "", "Prairie Inn Harriers Runni", " 25:03 "]
我可以指定要加入的索引,但我可能需要像这样抓取数千个文件,并且列并不总是以相同的顺序排列。
一个常量是列数据永远不会长于列名和数据之间的分隔符(the ====
)。我试图利用这一点来发挥自己的优势,但发现了一些漏洞。
我需要编写一个算法来检测名称列中保留的内容以及其他“单词”列中保留的内容。有什么想法吗?