Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有一个带有单词搜索方表的 pdf 文档。它看起来像这样:
我想让单词搜索网格中的所有单词以某种方式导出为 xml 或 json 格式。是否有为此类任务构建的软件?或者如何构建一个简单的脚本来做到这一点,有可能吗?
我使用单词搜索软件来生成这个网格,但它只能导出为 SVG 和 PDF。
我想要实现的是:对于每个单词,我想要网格中的起始坐标,也可能是结束坐标,或者单词的方向可能会很好。我能以某种方式将这些东西导出到 json/xml 中吗
这可能会有所帮助,它只能在 windows 和 linux 上使用
https://code.google.com/p/pdf2json/
我原以为使用 SVG 版本的导出会是一种更简单的方法。运气好的话,单词列表将只是<text>在文件的一部分中组合在一起的元素列表。从那里编写一个小脚本将它们转换为 JSON 会很简单。
<text>