我一直在寻找从静态网页创建索引的程序。我不是在寻找像 Solr 或 elasticsearch 这样的程序,因为两者都假设我将以交互方式创建索引。我需要一些基本上可以访问 url,并从它提取的页面创建搜索索引的东西。它可以以任何必要的方式创建索引(db、xml 等) ,在不使用任何这些的网站上。
感谢您提供任何可以帮助我入门的提示或可以解决我的问题的答案!
我一直在寻找从静态网页创建索引的程序。我不是在寻找像 Solr 或 elasticsearch 这样的程序,因为两者都假设我将以交互方式创建索引。我需要一些基本上可以访问 url,并从它提取的页面创建搜索索引的东西。它可以以任何必要的方式创建索引(db、xml 等) ,在不使用任何这些的网站上。
感谢您提供任何可以帮助我入门的提示或可以解决我的问题的答案!
调查纳奇。Nutch 可以索引一个 URL,并且您可以索引的内容是非常可配置的。
完成爬网/索引后,该索引即可搜索。不涉及编程。