我有一个具有以下格式的巨大文本文件(作为 ASCII 文件)。我正在使用 python 来处理相同的内容。对于这种文件,我有几个问题(以更通用的方式)。
- 如何检查数据格式的正确性?有没有办法指定一个模板,然后验证这些文本文件的正确性?(类似于 xml 的 dtd 文件)。
- 第二个问题是解析此类文件并从文件中读取数据。就像我希望
XYZ
数据出现time
在行之后并且需要解析它们一样。这种情况有什么简单的机制吗?再次像模板和解析机制。
===========================BEGIN=========================================
2012-12-05 12:03
XYZ 123(0) 654(2) 232(4)
MON 23(0) 54(2) 32(4)
POR 13(0) 64(1) 92(2)
=========================== END =========================================
===========================BEGIN=========================================
2012-12-05 12:04
XYZ 123(0) 654(2) 232(4)
MON 23(0) 54(2) 32(4)
POR 13(0) 64(1) 92(2)
=========================== END =========================================
===========================BEGIN=========================================
2012-12-05 12:05
XYZ 523(0) 654(2) 235(4)
MON 83(0) 54(2) 32(4)
POR 13(0) 64(1) 92(2)
=========================== END =========================================
===========================BEGIN=========================================
2012-12-05 12:03
XYZ 193(0) 644(2) 232(4)
MON 23(0) 54(2) 32(4)
POR 13(0) 64(1) 92(2)
=========================== END =========================================