2

因此,我制作了一个简短的 Python 脚本,通过首先检查它们的幻数/文件签名来在 Windows 中启动具有不明确扩展名的文件:

我想将它编译为 .exe 以使关联更容易(使用 bbfreeze 或用 C 重写),但我需要某种用户友好的配置文件来指定匹配的字节字符串和程序路径。基本上我想以某种方式将此信息放入纯文本文件中:

magic_numbers = {
# TINA
'OBSS': r'%PROGRAMFILES(X86)%\DesignSoft\Tina 9 - TI\TINA.EXE',

# PSpice
'*version': r'%PROGRAMFILES(X86)%\Orcad\Capture\Capture.exe', 
'x100\x88\xce\xcf\xcfOrCAD ': '', #PSpice?

# Protel
'DProtel': r'%PROGRAMFILES(X86)%\Altium Designer S09 Viewer\dxp.exe', 

# Eagle
'\x10\x80': r'%PROGRAMFILES(X86)%\EAGLE-5.11.0\bin\eagle.exe',
'\x10\x00': r'%PROGRAMFILES(X86)%\EAGLE-5.11.0\bin\eagle.exe',
'<?xml version="1.0" encoding="utf-8"?>\n<!DOCTYPE eagle ': r'%PROGRAMFILES(X86)%\EAGLE-5.11.0\bin\eagle.exe',

# PADS Logic
'\x00\xFE': r'C:\MentorGraphics\9.3PADS\SDD_HOME\Programs\powerlogic.exe', 
}

(十六进制字节只是任意字节,而不是 Unicode 字符。)

我猜这种格式的 .py 文件可以工作,但我必须让它未编译,并以某种方式仍将其导入到已编译的文件中,并且仍然有一堆无关的内容,比如{,混淆/搞砸。

我查看了 YAML,它会很棒,只是它首先需要 base64 编码的二进制文件,而这并不是我真正想要的。我希望配置文件包含字节的十六进制表示。还有 ASCII 表示,如果这就是文件签名的全部内容的话。也许还有正则表达式。:D(例如,如果基于 XML 的格式可以用不同数量的空格编写)

有任何想法吗?

4

3 回答 3

1

你已经得到了答案:YAML。

您在上面发布的数据是存储二进制数据的文本表示;这对 YAML 来说很好,你只需要正确解析它。通常你会使用 binascii 模块中的一些东西;在这种情况下,可能是binascii.a2b_qp函数。

magic_id_str = 'x100\x88\xce\xcf\xcfOrCAD '
magic_id = binascii.a2b_qp(magic_id_str)

为了说明,我将使用 unicode 字符作为将二进制数据粘贴到 REPL (Python 2.7) 中的一种简单方法:

>>> a = 'Φ'  
>>> a  
'\xce\xa6'  
>>> binascii.b2a_qp(a)  
'=CE=A6'  
>>> magic_text = yaml.load("""  
... magic_string: '=CE=A6'  
... """)  
>>> magic_text  
{'magic_string': '=CE=A6'}  
>>> binascii.a2b_qp(magic_text['magic_string'])  
'\xce\xa6'  
于 2012-03-13T17:41:37.167 回答
1

我会建议这样做有点不同。我会将这两个设置相互分离:

  1. 幻数签名 ===> mimetype
  2. mimetype ==> 程序启动器

对于第一部分,我将使用python-magic,一个与libmagic绑定的库。您可以让 python-magic 使用这样的自定义魔法文件:

import magic
m = magic.Magic(magic_file='/path/to/magic.file')

您的用户可以指定将幻数映射到 mimetype 的自定义幻数文件。魔术文件的语法已记录在案。这是一个显示 TIFF 格式的魔术文件的示例:

# Tag Image File Format, from Daniel Quinlan (quinlan@yggdrasil.com)
# The second word of TIFF files is the TIFF version number, 42, which has
# never changed.  The TIFF specification recommends testing for it.
0       string          MM\x00\x2a      TIFF image data, big-endian
!:mime  image/tiff
0       string          II\x2a\x00      TIFF image data, little-endian
!:mime  image/tiff

第二部分非常简单,因为您现在只需要指定文本数据。您可以按照其他人的建议使用 INI 或 yaml 格式,或者您甚至可以只有一个简单的制表符分隔文件,如下所示:

image/tiff         C:\Program Files\imageviewer.exe
application/json   C:\Program Files\notepad.exe
于 2012-03-13T20:12:29.030 回答
-1

我使用了一些包来构建配置文件,还有 yaml。我建议您使用 ConfigParser 或 ConfigObj。

最后,最好的选择如果你想构建一个带有注释的人类可读的配置文件,我强烈建议使用 ConfigObj。

享受!

ConfigObj 示例

使用此代码:

您也可以使用 ConfigObj 来存储它们。试试这个:import configobj

def createConfig(path):
    config = configobj.ConfigObj()
    config.filename = path
    config["Sony"] = {}
    config["Sony"]["product"] = "Sony PS3"
    config["Sony"]["accessories"] = ['controller', 'eye', 'memory stick']
    config["Sony"]["retail price"] = "$400"
    config["Sony"]["binary one"]= bin(173)
    config.write()

你得到这个文件:

[Sony]
product = Sony PS3
accessories = controller, eye, memory stick
retail price = $400
binary one = 0b10101101
于 2012-03-13T16:30:45.577 回答