我是使用编程语言的新手,我在解决这个特定问题时遇到了麻烦。我是一名记者,试图使用 Python 重组来自县调度办公室的 .txt 文件中提供的 911 数据。
这是一个呼叫以当前格式出现的方式:
Incident Number: PD160010001
Incident Type: SUSPICIOUS PERSON(S)
EMS Blk: 186605 Fire Blk: 65005 Police Blk: 22145
Location: Location name,22
at XXXX Name RD ,22
Entered: 01/01/16 00:00
Dispatched: 01/01/16 00:00
Enroute: 01/01/16 00:00
On Scene: 01/01/16 00:00
Transport: / / :
Trans Complete: / / :
Closed: 01/01/16 00:04
01/01/16 00:00 OUTSRV
01/01/16 00:00 DISPOS 22H4
01/01/16 00:00 PREMPT 22H4
01/01/16 00:00 DISPOS 2212
01/01/16 00:00 EXCH 22H4
01/01/16 00:01 ADDER 22H4
01/01/16 00:04 CLEAR 2212
01/01/16 00:04 CLEAR 22H4
01/01/16 00:04 CLOSE 22H4
我能够在 Excel 中使用 Right 和 Left 函数和其他一些步骤来重新组织它,以获得如下结果:
Incident Number Incident Type EMS Blk: Closed
PD160010001 SUSPICIOUS PERSON(S) 186605 ... 01/01/16 00:04
每个事件底部有调度时间的 9-10 行数据是多余的,没有必要。
我遇到的麻烦是找到一种方法告诉 Pandas 将名称放在冒号左侧并将其识别为一个列标题,同时将信息放在列的右侧并将其分配给相应的列,然后重复直到关闭列之后并跳过冗余信息。
.txt 文件中一年的数据价值约为 600 万行,并且在重新组织后减少到略高于 501,000 行。手动在 excel 中完成每个文件大约需要 4 个小时,我想对 10 年的调用时间进行分析。
我需要学习在 Python 中执行此操作,以使其成为一个实用的项目。谢谢大家。第一次在这里发问题。