Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
嘿,所以我开始研究 Solr 并对 Solr 的工作原理有几个问题。我知道架构定义了 Solr 应用程序中存储和索引的内容。但我很困惑 Solr 如何知道“内容”是网站的内容或 url 是 url?
我的主要目标是尝试从网站中提取电话号码,并且我希望 Solr 能够很好地吐出 1234567890。
您需要在 Solr schema.xml 中通过声明所有字段及其字段类型来定义它。然后,您可以查询 Solr 以查找要搜索的任何字段。
请参考:http ://wiki.apache.org/solr/SchemaXml
Solr 不会自动索引网站的内容。您需要告诉它如何索引您的内容。Solr 只知道您告诉它知道的内容。提取电话号码听起来很简单,因此编写更新脚本或在线查找应该不是问题。祝你好运!