我有许多 TIFF 文件,其中包含描述和“关键字”(正如 OS X 在文件检查器中所说的那样)。但是,我很难从图像中收集这些元数据。
我尝试使用tifffile.py、PIL的 exif 命令和IPTCInfo,虽然 tifffile.py会得到描述,但我似乎仍然无法使用这些库中的任何一个解析文件中的“关键字”。
存储关键字的 TIFF 与 JPEG 是否使用不同的“规范”?解析这些关键字的最佳方法是什么?
编辑
除了来自 的评论abarnert
,我在文本编辑器中打开了一个 TIFF 文件,发现有包含“关键字”的 XML 数据。片段如下:
...
<rdf:Description rdf:about=""
xmlns:dc="http://purl.org/dc/elements/1.1/">
<dc:description>
<rdf:Alt>
<rdf:li xml:lang="x-default">OLYMPUS DIGITAL CAMERA</rdf:li>
</rdf:Alt>
</dc:description>
<dc:format>image/tiff</dc:format>
<dc:subject>
<rdf:Bag>
<rdf:li>Foo</rdf:li>
<rdf:li>Bar</rdf:li>
<rdf:li>A long keyword</rdf:li>
</rdf:Bag>
</dc:subject>
</rdf:Description>
...
看起来这可以存储为二进制表示;tifffile.py 列出了一些本质上是整数元组的标签。但是,我不确定如何转换它。建议?