1

我有一个带有单词搜索方表的 pdf 文档。它看起来像这样:

截屏

我想让单词搜索网格中的所有单词以某种方式导出为 xml 或 json 格式。是否有为此类任务构建的软件?或者如何构建一个简单的脚本来做到这一点,有可能吗?

我使用单词搜索软件来生成这个网格,但它只能导出为 SVG 和 PDF。

我想要实现的是:对于每个单词,我想要网格中的起始坐标,也可能是结束坐标,或者单词的方向可能会很好。我能以某种方式将这些东西导出到 json/xml 中吗

4

2 回答 2

1

这可能会有所帮助,它只能在 windows 和 linux 上使用

https://code.google.com/p/pdf2json/

于 2013-08-15T13:36:05.980 回答
1

我原以为使用 SVG 版本的导出会是一种更简单的方法。运气好的话,单词列表将只是<text>在文件的一部分中组合在一起的元素列表。从那里编写一个小脚本将它们转换为 JSON 会很简单。

于 2013-08-16T03:46:15.577 回答