7

我正在开发一种文件准备软件,以使翻译人员能够轻松有效地处理各种文件格式。

就基于文本的格式(xml、php、资源文件...)而言,我的小型准备实用程序运行良好,但对于大多数翻译人员来说,一个主要问题是处理各种专有的二进制格式(Framemaker、Publisher、夸克……)。

这些文件很少被请求并且需要在昂贵的应用程序中打开(很少有自由职业者能买得起价值 20,000 美元的软件来每年处理几个项目),即便如此,直接在这些应用程序中工作也不方便。

我希望能够读取这些文件并以这样的方式提取文本,以便可以翻译它然后以最小的努力重新导入到原始应用程序中,甚至更好地重新创建一个有效的本机二进制文件。

这听起来可行吗?

我在哪里可以找到有关处理二进制文件格式的更多信息,以及这些工作是否有有用的工具(除了常规的十六进制编辑器)?

提前致谢。

4

3 回答 3

5

当然逆向工程是可能的,但如果没有格式规范,它将需要大量工作。我会考虑支持这些“很少要求,非常昂贵”的格式的努力回报。花费这些精力改进应用程序的核心功能可能会更好。

另一个角度是与这些格式的公司联系,解释你的目标,解释这有助于他们的产品,如果他们不认为你是竞争对手,他们可能愿意提供帮助。

于 2009-06-18T20:13:34.427 回答
1

我知道你想对它们进行逆向工程 - 但由于这些可能是适当的文件格式,你正在寻找一个非常陡峭的曲线来尝试解码它们......

有些(因为我之前写过一些内部使用的专有格式)具有写入其中的特定方法和对象,这些方法和对象提供了一些替代过程而不是文件内容本身。可以证明新文件是非法的东西。

只有我的 2 美分,我不是律师 =>

于 2009-02-03T13:48:37.067 回答
0

也许您可以选择一个具有 QuarkXPress 导入功能的更便宜的应用程序。例如,InDesign 应该能够读取 Quark 文档。然后使用导入应用程序导出到您需要的任何格式 - 可能在插件的帮助下。

于 2009-02-03T14:08:28.743 回答