我正在尝试为 .ppt 文件构建一个 JavaScript 解析器。PPTX 没什么大不了的,因为它是一种“开放”格式,但我真的迷失了 .ppt 文件的文件结构,找不到任何有用的信息。
鉴于此,有没有人试过这个,或者至少可以指出我可以在哪里看到 .ppt 的“规范”,以便我可以构建解析器?
最好的问候, 塞尔索桑托斯
我正在尝试为 .ppt 文件构建一个 JavaScript 解析器。PPTX 没什么大不了的,因为它是一种“开放”格式,但我真的迷失了 .ppt 文件的文件结构,找不到任何有用的信息。
鉴于此,有没有人试过这个,或者至少可以指出我可以在哪里看到 .ppt 的“规范”,以便我可以构建解析器?
最好的问候, 塞尔索桑托斯
.ppt 是一种二进制文件格式。您可以在此处阅读 1997-2007 规范
不要阻止您尝试,但您应该注意,对于 1 个开发人员来说,这可能最终成为一项艰巨/几乎不可能完成的任务,因为整个规范代表了 10 年内数千个编程小时。
Joel Spolsky 有一篇关于处理这些文件格式的好文章。
为了完整起见,这里是 pptx 文件格式的规范。
你的梦想得到了回应……
有人构建了一个纯 JavaScript PPT 二进制文件解析器。在 Git https://github.com/SheetJS/js-ppt上查看