0

设想:

Blob存储:包含pdf、word、图片文件(约70个文件)

我使用默认字段和预定义技能通过 Azure 门户创建 Azure 搜索实例。

但是查询这些文件中的任何文本的结果都不是很好。我将内容和关键短语设置为可搜索和可检索的。我尝试使用 Lucene 分析器,但帮助不大。

主要担心的是,如果我在搜索资源管理器中输入一个字母,例如“u”,它会返回文件。据我了解,我的文件中没有这个词。那么它在做什么呢?

如何细化搜索?以及如何操纵结果?

我不是文件处理方面的专家。因此使用 blob 中的非结构化文档而不是 JSON 格式的文档。

另一件事,如何在索引中定义一些字段,比如可以与 PDF 章节/标题名称相关的章节名称或标题名称?

请给我一些想法或一些示例链接。我正在使用 .net core 来开发它。

4

1 回答 1

0

使用自定义技能集来提取您需要的字段,并确保这些字段在 index.html 中定义。

于 2019-05-02T13:03:01.357 回答