我试图在这里确定“适合这项工作的工具”,我相信认知服务可以做到这一点,但不会消失在研发兔子洞中,我想我会确保我首先在正确的方向上挖隧道。
所以,这里是简短的:
我有一组我想要查找的已知现有短语,但这些短语的书写方式可能略有不同,无论是语法还是语言。
我希望能够解析(可能很大)大量文本以扫描并查找这些短语,以便我可以识别它们。
例如,我的短语可能是“事件将亲自进行”,但这也需要识别语言的不同用途;例如“in-person event”、“face to face event”或“on-site event”——以及你可以通过这些东西获得的各种同义词和变体。
LUIS最初似乎是这类事情的首选工具,并且包括编写自己的功能(又名短语列表)以增强模型的能力,但目前尚不清楚这是否会达到简报 - LUIS出现更多地关注“意图”和用户交互(例如构建聊天机器人,或从电子邮件中理解意图)。
文本分析似乎也是一个可能的候选者,但似乎更侧重于识别“实体”(例如人/地点/组织)而不是自然语言“短语”——如果我定义自己的“主题”或那真的只是在叫错树吗?
.. 或者... 实际上还有什么我应该看完全不同的东西吗?
在这一点上 - 我真的在寻找“我应该花很多时间学习哪个工具”。
在此先感谢大家-我很欣赏这是一个相当开放的要求。