1

我不知道如何开始解决这个问题,所以任何建议都会有所帮助。

我的客户端有许多静态 HTML 页面,它们运行在数百个文件中。这些不时更新,并在网站上被覆盖。我们通过一个简单的左侧浏览器在网站上列出这些页面,该浏览器模仿了将这些文件提供给我们的文件夹结构。

我们现在希望能够搜索这些文件并显示匹配结果。通过如此大量的文件进行暴力搜索将非常耗时。匹配相关词(例如复数、拼写错误等)也是可取的。按受欢迎程度显示结果将是一个有用的功能。我不知道如何开始。例如,我们是否应该在每次更新后预处理 html 文件?.NET 中有哪些推荐的索引库?网站上的一些小程序都是使用 C# 完成的。

谢谢女士

4

3 回答 3

2

Lucene.net可能很有趣。

于 2012-12-06T14:15:13.633 回答
1

我首先编写一个简单的程序将所有这些文件内容传输到数据库。然后,您可以正确实施您的搜索,而不必每次都读取所有文件。

于 2012-12-06T14:14:52.697 回答
0

我不确定它是否在您的预算之内,但正如 user1161318 指出的那样,Google 可以为您完成。

试试谷歌网站搜索 - http://www.google.co.uk/enterprise/search/products_gss.html

于 2012-12-06T14:08:15.737 回答