4

可能重复:
通过 javascript 对 CD-Rom 上的静态 HTML 文件进行全文搜索

我正在开始开发一个应用程序,该应用程序在本地创建一堆 HTML 文件,然后可以在系统(包括移动设备)上的任何 Web 浏览器中浏览它们被复制到的位置。HTML 文件具有许多交互功能,因此它本质上是一个离线网络应用程序。我的问题是,对这些 HTML 文件实施全文搜索的最佳方法是什么?基本上,应用程序应该索引它生成的 HTML 文件,但我们希望能够制作 HTML 文件和生成的索引可下载并可供用户离线浏览和搜索。在不编写实际应用程序来管理它的情况下,最好的方法是什么?例如,我已经使用 Solr 实现了它以进行演示/概念验证,并且效果很好……但当然,这需要对服务器进行 HTTP POST 和 GET 请求以进行索引和查询。因此,由于索引实际上只是文件,我想知道是否有一种方法可以在 HTML 文件中仅使用 Javascript 来离线查询它们(并且无需为 Solr 启动本地 Web 服务器),也许使用 Lucene 而不是 Solr?

4

1 回答 1

1

感谢您向我介绍了一些完全用 Javascript 编写的文本搜索解决方案!我想查看文本搜索的代码。


Lucene 是用 Java 编写的,它需要一个 Java(技术上是 JVM)进程才能访问。

PS1:如果您正在滚动自己的简单文本搜索,JS 中的词干分析器将使其更有用。

original: run running cat cats love loving crap crapping
stemmed: run run cat cat love love crap crap 

PS2:您也可以运行另一个“Ngram-ized”索引进行拼写检查。


于 2012-04-28T09:59:53.607 回答