0

嘿,所以我开始研究 Solr 并对 Solr 的工作原理有几个问题。我知道架构定义了 Solr 应用程序中存储和索引的内容。但我很困惑 Solr 如何知道“内容”是网站的内容或 url 是 url?

我的主要目标是尝试从网站中提取电话号码,并且我希望 Solr 能够很好地吐出 1234567890。

4

2 回答 2

0

您需要在 Solr schema.xml 中通过声明所有字段及其字段类型来定义它。然后,您可以查询 Solr 以查找要搜索的任何字段。

请参考:http ://wiki.apache.org/solr/SchemaXml

于 2012-06-23T12:30:20.973 回答
0

Solr 不会自动索引网站的内容。您需要告诉它如何索引您的内容。Solr 只知道您告诉它知道的内容。提取电话号码听起来很简单,因此编写更新脚本或在线查找应该不是问题。祝你好运!

于 2012-06-23T13:44:12.337 回答