目前我们使用多语言通用句子编码器(MUSE)进行相似度评分。我们有一个聊天机器人系统,我们可以在其中使用每个意图的样本列表来定义意图。然后我们将用户话语的语义相似性与每个意图样本进行比较,以确定该话语是否属于任何意图。
但我不知道我们如何处理组织名称(或任何名称实体),例如,如果我们有意图 ask_info,我们想要诸如“告诉我有关 Google 的信息”或“告诉我有关三星的信息”之类的句子属于那个意图。但是如果我们只放 1 个句子作为样本,比如“Tell me info about Google”,如果用户输入“Tell me about XXX”,则 MUSE 的相似度得分非常低,只有 0.4 ~ 0.5 左右,无法通过我们的阈值。所以有人有想法处理这种情况吗?非常感谢。