我有许多需要提取和格式化数据的日志文件。其中一些日志文件非常大,超过 10,000 行。
任何人都可以建议一个代码示例来帮助我阅读文本文件,删除不需要的行,然后将剩余的行编辑为特定格式。我无法找到任何具有我所追求的以前的线程。
我需要编辑的数据示例如下:
136: add student 50000000 35011 / Y01T :Unknown id in field 3 - ignoring line
137: add student 50000000 5031 / Y01S :Unknown id in field 3 - ignoring line
138: add student 50000000 881 / Y01S :Unknown course idnumber in field 4 - ignoring line
139: add student 50000000 5732 / Y01S :Unknown id in field 3 - ignoring line
134: add student 50000000 W250 / Y02S :OK
135: add student 50000000 35033 / Y01T :OK
我需要搜索文件并删除任何以 :OK 为后缀的行。然后,我需要将剩余的行编辑为 CSV 格式,例如:
add,student,50000000,1234 / abcd
任何提示、代码片段等都会非常有帮助,我将不胜感激。在询问之前我会先尝试,但我没有时间自学 python 文件访问/字符串格式。所以请允许我提前为在询问之前没有尝试过而道歉