我正在尝试.pbix
使用 python 的zipfile
库检查 PowerBI 文件。
解压缩.pbix
存档时,我得到以下结构:
DataMashup
DataModel
DiagramLayout
Metadata
Report
ReporLayout
ReporStaticResources
ReporStaticResourceSharedResources
ReporStaticResourceSharedResourceBaseThemes
ReporStaticResourceSharedResourceBaseThemeCY18SU07.json
SecurityBindings
Settings
Version
[Content_Types].xml
DataMashup
存档中的文件似乎是目录的.pbix
某种非品牌存档。
该DataMashup
对象似乎没有被压缩,因为我可以xml
在 python 解释器中打印对象时轻松读取数据。
使用7zip
我可以访问以下内容:
DataMashup/
Config/
Package.xml
Formulas/
Section1.m # m and/or dax looking stuff
[Content_Types].xml
如何发现DataMashup
存档中存档的格式?
一个线索在对象顶部的二进制数据中DataMashup
:\x00\x00\x00\x00\x07\x05\x00\x00PK
这可能表示 pkzip。
尝试unzip
在DataMashup
文件上使用时,另一个线索可能是此输出:
$ unzip DataMashup
Archive: DataMashup
warning [DataMashup]: 6215 extra bytes at beginning or within zipfile
我能够使用以下命令解压缩DataMashup
linux 上的目录7za
:
WARNINGS:
There are data after the end of archive
--
Path = DataMashup
Type = zip
WARNINGS:
There are data after the end of archive
Offset = 8
Physical Size = 1303
Tail Size = 5148
Everything is Ok
Archives with Warnings: 1
Warnings: 1
Files: 3
Size: 2040
Compressed: 6459
尽管有警告,但文件看起来还不错。不幸的是,这对我在 Windows 上没有帮助。