11

我有日志文件(以 YYMMDD 格式命名),我想创建一个仅从文件中获取重要信息的脚本(例如包含 "O:NVS:VOICE" 的行)。我以前从未使用过 Python,所以请帮忙!

4

2 回答 2

27

这应该让你很好地开始:

infile = r"D:\Documents and Settings\xxxx\Desktop\test_log.txt"

important = []
keep_phrases = ["test",
              "important",
              "keep me"]

with open(infile) as f:
    f = f.readlines()

for line in f:
    for phrase in keep_phrases:
        if phrase in line:
            important.append(line)
            break

print(important)

它绝不是完美的,例如没有异常处理或模式匹配,但你可以很容易地添加这些。查看正则表达式,这可能比短语匹配更好。如果您的文件很大,请逐行阅读以避免 MemoryError。

输入文件:

This line is super important!
don't need this one...
keep me!
bla bla
not bothered
ALWAYS include this test line

输出:

['This line is super important!\n', 'keep me!\n', 'ALWAYS include this test line']

注意:这是 Python 3.3。

于 2013-04-15T14:33:34.610 回答
18

您需要知道如何遍历目录中的文件正则表达式以确保您的日志文件格式与您正在循环的文件匹配如何打开文件如何遍历打开文件中的行,以及如何检查其中一行是否包含您要查找的内容

这里有一些代码可以帮助您入门。

with open("log.log" 'r') as f:
    for line in f:
        if "O:NVS:VOICE" in line:
            print line
于 2013-04-15T14:22:46.513 回答