4

我正在尝试让 Kaitai Struct 解析 MP3 的 ID3v1 标签格式。根据标准,它是位于某个偏移量处的固定格式结构——但诀窍是这个偏移量不是从文件的开头计算的,而是从结尾计算的。

这是标签的基本.ksy轮廓,我认为它不应该真正改变:

meta:
  id: id3v1
types:
  id3v1_tag:
    seq:
      - id: magic
        contents: 'TAG'
      - id: title
        size: 30
      - id: artist
        size: 30
      - id: album
        size: 30
      - id: year
        size: 4
      - id: comment
        size: 30
      - id: genre
        type: u1

这是我关于如何从 128 个字节到文件末尾读取它的幼稚想法:

instances:
  tag:
    pos: -128
    type: id3v1_tag

我尝试使用一个简单的 Python 测试脚本:

#!/usr/bin/env python

from id3v1 import *

f = Id3v1.from_file('some_file_with_id3.mp3')
print(f.tag)

但是,它似乎将负数直接传递到 Python 的 File 对象中seek(),因此失败了:

回溯(最后一次调用):文件“try-id3.py”,第 6 行,在 print(f.id3v1_tag) 文件“id3v1_1.py”,第 171 行,在 id3v1_tag self._io.seek(-128) 文件中“ kaitaistruct.py",第 29 行,在 seek self._io.seek(n) IOError: [Errno 22] Invalid argument

在其他一些同样疯狂的想法之后,我找到了一种解决方法:我可以省略任何pos参数,.ksy然后手动寻找脚本中的正确位置:

f = Id3v1.from_file('some_file_with_id3.mp3')
f._io.seek(-128, 2)
print(f.tag.title)

这行得通,但感觉真的很hackish :(在 Kaitai Struct 和 Python 中有更好的方法吗?

4

1 回答 1

2

Kaitai Struct 即将发布的 v0.4 中有一个新功能可以解决这个问题。您可以_io用来获取当前流对象,然后您可以.size用来获取当前流的全长(以字节为单位)。因此,如果您想通过与流末尾的固定偏移量来处理某些结构,您需要在 .ksy 中使用类似的东西:

instances:
  tag:
    pos: _io.size - 128
    type: id3v1_tag

请注意,虽然当前稳定版是 v0.3,但您必须从 Github 下载并构建编译器 + 运行时并使用最新版本。

于 2016-08-08T10:54:36.073 回答