我有兴趣构建一个软件系统,该系统将连接到各种文档源,从每个源中包含的文档中提取内容,并将提取的内容提供给 Elastic 或 Solr 等搜索引擎。该搜索引擎将作为基于 Web 的搜索应用程序的后端。
我有兴趣在搜索结果中呈现这些文档的片段,以查找 Microsoft Word 和 PDF 等知名类型。如何在搜索中实现文档片段呈现?
我很乐意以任何格式提供这些片段,包括图像。我只是希望能够为我的用户提供某种格式的预览,以了解他们对知名类型的结果。
谢谢!
我有兴趣构建一个软件系统,该系统将连接到各种文档源,从每个源中包含的文档中提取内容,并将提取的内容提供给 Elastic 或 Solr 等搜索引擎。该搜索引擎将作为基于 Web 的搜索应用程序的后端。
我有兴趣在搜索结果中呈现这些文档的片段,以查找 Microsoft Word 和 PDF 等知名类型。如何在搜索中实现文档片段呈现?
我很乐意以任何格式提供这些片段,包括图像。我只是希望能够为我的用户提供某种格式的预览,以了解他们对知名类型的结果。
谢谢!