我发现了一些与 XML 搜索相关的帖子,但这些帖子对我的任务没有帮助。
我的任务是实现搜索。来源:5-6 个 XML 文件,如人物、建筑物、新闻等(每个类别都是一个 XML 文件,我总共有 30000 个条目)。用户可以选择一个类别并输入一些关键字。搜索短语应该搜索 XML 文件并返回结果显示在 html 页面上。如果用户未选择类别,则应搜索所有 XML 文件。
请告诉我实现此和最佳技术的最佳策略/算法。
转换您的 XML 文档(使用 XSL)并将它们(HTTP 发布)上传到Solr的实例。然后,您将能够对索引数据执行一系列搜索操作。
Solr Wiki目前不可用,但这里是它支持 XML 格式的示例:
<add>
<doc>
<field name="employeeId">05991</field>
<field name="office">Bridgewater</field>
<field name="skills">Perl</field>
<field name="skills">Java</field>
</doc>
[<doc> ... </doc>[<doc> ... </doc>]]
</add>