8

我正在寻找创建一个 Facebook 应用程序,但我想使用的数据不可用,除了 CHM 格式。

是否可以将 CHM 文件转换为 CSV 或 SQL?我们有这方面的现有工具吗?

一如既往地感谢您的帮助。

4

2 回答 2

3

顺便说一句,您应该指定您希望构建此数据集的语言(英语、阿拉伯语...),因为这会影响书籍来源的选择和转换实用程序。

识别数据内容来源
有趣的是,对于所有 [交互式] 在线圣训搜索工具,例如
CRCC 的穆斯林文本纲要网站上的工具(最初来自MSA West,但不知何故不再可用/在 MSA 网站上工作),没有似乎不是任何可下载的底层数据库版本!
书籍本身有几个在线版本,特别是您提到的流行书籍,但是您需要正确解析和索引它们以保留参考资料等。此外,“回到”书籍,您必须把它们联系起来。

关于转换 CHM 文件……据
我所知,没有开源或免费软件程序,但共享软件ABC Amber CHM 转换器(约 25.00 美元)似乎是为此目的的黄金标准。
几年前,我只是暂时接触过这个软件,因为它是一次性转换工作,类似于你正在考虑的工作。Amber 转换器“成功了”;幸运的是,帮助页面的底层结构暴露了很多规律性,允许相对直接的表格进入 CSV/数据库字段。
ABC Amber 转换器支持多种语言,包括阿拉伯语(但我仅将其用于英语)。

于 2010-04-14T15:27:15.060 回答
1

有一个众所周知的开源 *nix 库,称为 libchm,大多数 *nix chm 查看器都基于它。它带有一个工具,可将 .chm 解压缩为其 .html 原件(然后您必须将 html 表转换为 .csv)

Lazarus/Free Pascal 也有库,甚至可以编写,但 afaik 没有现成的“chm 编译器”工具。

于 2010-04-14T20:55:09.353 回答