我是代表某人问的,所以我没有太多细节。
哪些选项可用于索引 ASP.NET 网站中的网站内容?如果页面内容存储在数据库中,我怀疑可能会使用 SQL Server 的全文索引。如果动态和静态内容不存储在数据库中,而是存储在 html 和 aspx 页面本身中,我将如何索引该内容?
我是代表某人问的,所以我没有太多细节。
哪些选项可用于索引 ASP.NET 网站中的网站内容?如果页面内容存储在数据库中,我怀疑可能会使用 SQL Server 的全文索引。如果动态和静态内容不存储在数据库中,而是存储在 html 和 aspx 页面本身中,我将如何索引该内容?
您可以使用网络爬虫来爬取该站点并将内容添加到数据库中,然后该数据库会被全文索引。那里有许多网络爬虫。
Lucene 是一个众所周知的开源工具,可以在这里为您提供帮助。主要分支是基于 Java 的,但也有一个 .Net 端口。
主站:http : //lucene.apache.org/ 网口:http: //incubator.apache.org/lucene.net/
几年前,我们购买了 Karamasoft Ultimate Search 。它是您网站的搜索引擎插件。我喜欢它,因为它是一个简单的工具,可以教会我们在我们的网站上进行搜索。它非常便宜,我们知道如果我们需要更多或不同的功能,我们可以稍后购买。我们需要一些可以让我们搜索而无需进行大量编程的东西。
具体来说,这个工具是一个网络爬虫。它将在您的网络服务器上运行,它会像最终用户一样在您的网站中导航并记录您的网页,因此当真正的用户搜索时,他们会被告知包含他们想要的内容的页面。
请记住,它就像最终用户一样,因此您的动态数据与静态数据一起被编入索引,因为它为最终网页编入索引。我们需要这个功能,这是最吸引我们的地方。
使用了几种替代方法后,除了Google Site Search之外,我不愿意做任何事情。
我使用 SQL 全文搜索的唯一原因是搜索多个列。很难以任何有效的方式实施它。