0

我试图在这里确定“适合这项工作的工具”,我相信认知服务可以做到这一点,但不会消失在研发兔子洞中,我想我会确保我首先在正确的方向上挖隧道。

所以,这里是简短的:

我有一组我想要查找的已知现有短语,但这些短语的书写方式可能略有不同,无论是语法还是语言。

我希望能够解析(可能很大)大量文本以扫描并查找这些短语,以便我可以识别它们。

例如,我的短语可能是“事件将亲自进行”,但这也需要识别语言的不同用途;例如“in-person event”、“face to face event”或“on-site event”——以及你可以通过这些东西获得的各种同义词和变体。

LUIS最初似乎是这类事情的首选工具,并且包括编写自己的功能(又名短语列表)以增强模型的能力,但目前尚不清楚这是否会达到简报 - LUIS出现更多地关注“意图”和用户交互(例如构建聊天机器人,或从电子邮件中理解意图)。

文本分析似乎也是一个可能的候选者,但似乎更侧重于识别“实体”(例如人/地点/组织)而不是自然语言“短语”——如果我定义自己的“主题”或那真的只是在叫错树吗?

.. 或者... 实际上还有什么我应该看完全不同的东西吗?

在这一点上 - 我真的在寻找“我应该花很多时间学习哪个工具”。

在此先感谢大家-我很欣赏这是一个相当开放的要求。

4

1 回答 1

1

您的场景似乎更符合我们的文本分析服务。我将推荐Key Phrase Extraction API,它评估非结构化文本并返回关键短语列表。但是,由于您需要使用已知(自定义)短语列表,它可能不是您正在寻找的解决方案。我们目前不支持自定义关键字提取,但它在我们的路线图中。如果有兴趣,我们可以将您与产品团队联系,以了解有关您的方案的更多信息。

更新: 请尝试自定义 NER功能。

于 2021-10-22T20:30:48.133 回答