25

我有一个 python 脚本,它分析一组错误消息并检查每条消息是否与某个模式(正则表达式)匹配,以便对这些消息进行分组。例如,“文件 x 不存在”和“文件 y 不存在”将匹配“文件 .* 不存在”并被视为两次出现的“文件未找到”类别。

随着模式和类别的数量越来越多,我想将这些“正则表达式/显示字符串”放在一个配置文件中,基本上是某种字典序列化。

我希望这个文件可以手动编辑,所以我放弃了任何形式的二进制序列化,而且我宁愿不使用 xml 序列化来避免字符转义的问题(& <> 等等...... )。

你知道什么是实现这一目标的好方法吗?

更新:感谢 Daren Thomas 和 Federico Ramponi,但我不能有一个可能包含任意代码的外部 python 文件。

4

6 回答 6

38

我有时只是编写一个名为的python模块(即文件)config.py或具有以下内容的东西:

config = {
    'name': 'hello',
    'see?': 'world'
}

然后可以像这样“读取”:

from config import config
config['name']
config['see?']

简单的。

于 2008-10-09T12:32:37.557 回答
36

你有两个不错的选择:

  1. 使用ConfigParser 的Python 标准配置文件格式
  2. YAML使用PyYAML 之类的库

标准的 Python 配置文件看起来像带有[sections]key : valuekey = value对的 INI 文件。这种格式的优点是:

  • 无需第三方库
  • 简单、熟悉的文件格式。

YAML 的不同之处在于它被设计为一种对人类友好的数据序列化格式,而不是专门为配置而设计的。它非常易读,并为您提供了几种不同的方式来表示相同的数据。对于您的问题,您可以创建一个如下所示的 YAML 文件:

file .* does not exist : file not found
user .* not found : authorization error

或者像这样:

{ file .* does not exist: file not found,
  user .* not found: authorization error }

使用 PyYAML 再简单不过了:

import yaml

errors = yaml.load(open('my.yaml'))

此时errors是具有预期格式的 Python 字典。YAML 能够表示的不仅仅是字典:如果您更喜欢对列表,请使用以下格式:

-
  - file .* does not exist 
  - file not found
-
  - user .* not found
  - authorization error

或者

[ [file .* does not exist, file not found],
  [user .* not found, authorization error]]

调用时将生成列表列表yaml.load

YAML 的一个优点是您可以使用它将现有的硬编码数据导出到文件中以创建初始版本,而不是通过剪切/粘贴加上一堆查找/替换来将数据转换为正确的格式。

熟悉 YAML 格式需要更多时间,但使用 PyYAML 比使用 ConfigParser 更简单,其优点是您有更多关于如何使用 YAML 表示数据的选项。

任何一种听起来都适合您当前的需求,如果您的需求扩大,ConfigParser 将更容易开始,而 YAML 会在未来为您提供更多灵活性。

祝你好运!

于 2008-10-09T14:57:08.293 回答
8

我听说ConfigObj比 ConfigParser 更容易使用。它被许多大型项目使用,IPython、Trac、Turbogears 等......

从他们的介绍中

ConfigObj 是一个简单但功能强大的配置文件读取器和写入器:一个 ini 文件往返程序。它的主要特点是非常易于使用,具有简单的程序员界面和简单的配置文件语法。它还有很多其他功能:

  • 嵌套部分(子部分),到任何级别
  • 列出值
  • 多行值
  • 字符串插值(替换)
  • 与强大的验证系统集成
    • 包括自动类型检查/转换
    • 重复部分
    • 并允许默认值
  • 写出配置文件时,ConfigObj 保留所有注释以及成员和部分的顺序
  • 许多用于处理配置文件的有用方法和选项(如“重新加载”方法)
  • 完整的 Unicode 支持
于 2008-10-09T12:13:27.423 回答
4

我认为您想要标准库中的ConfigParser模块。它读取和写入 INI 样式文件。我链接到的标准文档中的示例和文档非常全面。

于 2008-10-09T12:00:52.957 回答
4

如果您是唯一有权访问配置文件的人,则可以使用简单的低级解决方案。将文本文件中的“字典”保存为元组列表(正则表达式,消息),就像它是 python 表达式一样:

[
("file .* does not exist", "file not found"),
("user .* not authorized", "authorization error")
]
在您的代码中,加载它,然后对其进行评估,并在结果中编译正则表达式:
f = open("messages.py")
messages = eval(f.read()) # caution: you must be sure of what's in that file
f.close()
messages = [(re.compile(r), m) for (r,m) in messages]
最后得到一个元组列表(compiled_regexp,message)。

于 2008-10-09T12:22:03.070 回答
3

我通常按​​照达伦的建议做,只需将您的配置文件设为 Python 脚本:

patterns = {
    'file .* does not exist': 'file not found',
    'user .* not found': 'authorization error',
}

然后您可以将其用作:

import config

for pattern in config.patterns:
    if re.search(pattern, log_message):
        print config.patterns[pattern]

顺便说一句,这就是 Django 对他们的设置文件所做的事情。

于 2008-10-09T12:57:56.787 回答