设想:
Blob存储:包含pdf、word、图片文件(约70个文件)
我使用默认字段和预定义技能通过 Azure 门户创建 Azure 搜索实例。
但是查询这些文件中的任何文本的结果都不是很好。我将内容和关键短语设置为可搜索和可检索的。我尝试使用 Lucene 分析器,但帮助不大。
主要担心的是,如果我在搜索资源管理器中输入一个字母,例如“u”,它会返回文件。据我了解,我的文件中没有这个词。那么它在做什么呢?
如何细化搜索?以及如何操纵结果?
我不是文件处理方面的专家。因此使用 blob 中的非结构化文档而不是 JSON 格式的文档。
另一件事,如何在索引中定义一些字段,比如可以与 PDF 章节/标题名称相关的章节名称或标题名称?
请给我一些想法或一些示例链接。我正在使用 .net core 来开发它。