我有一系列(数千个)通话记录,我正在尝试创建一个电子表格。它们都在一个文本文件中。格式如下所示:
12/ 13/ 05 Syracuse, NY 10: 22 AM 111- 111- 1111 2 $ - $ - $ -
12/ 13/ 05 New York, NY 10: 28 AM 111- 111- 1111 (F) 2 $ - $ - $ -
12/ 13/ 05 Orlando, FL 10: 48 AM 111- 111- 1111 (F) 4 $ - $ - $ -
3/ 9/ 09 Internal 4: 51 PM 111- 111- 1111 (E) 23 $ - $ - $ -
10/ 14/ 11 Colorado Site 8: 12 AM 111- 111- 1111 14 $ - $ - $ -
1/ 3/ 12 Dept 27 3: 16 PM 111- 111- 1111 (F) 93 $ - $ - $ -
11/ 12/ 12 Internal 3: 13 PM 18765 (E) 16 $ - $ - $ -
11/ 14/ 12 Internal 11: 43 AM John Doe 3 $ - $ - $ -
月/日/年/呼叫城市,州 HH:MM APM 123- 456 7890 OptionalCode $Charge $Tax $Total
这是,减去细节,直接来自文件。字符串周围没有引号,没有制表符。我尝试在列中使用文本,但有些城市确实有空间,而另一些则没有。
有人想指出我正确的方向吗?RegEx 也许(我听说过但从未使用过)?还有什么?
更新: 感谢您的早期反馈。该行是我文件中的实际数据,尽管我删除了城市和电话号码。我已经更新了城市信息以显示那里的差异。据我所知,没有一个城市名称有逗号,但我处理的总行数接近 120,000 行,而且显然还没有检查所有行。
显然,这座城市并不总是有空间——上面的雪城没有,但纽约却有。月份和日期也不总是 2 位数字——这也会影响长度检查。不过,我可以先阅读,然后再阅读第二个正斜杠 - 这些是在日期和月份值之后固定的。
括号中的代码并不总是出现......有时它在那里,有时不存在,尽管它们在到达时似乎只是一个字母。
我希望这可以解决一些问题。如果一开始就正确存储,这会容易得多。叹。
更新 2,3 和 4根据 Robin 的请求,从通话记录更改中添加了几行。