3

LUIS 是一个很好的工具。我们开始着手编写一个聊天机器人,我们想要使用 LUIS 服务。我们希望 LUIS 从给定文本中识别各种 Microsoft 产品。

假设,我希望 LUIS 将sharepoint 2010, sharepoint 2013, visual studio 2013, visual studio 2010" 等识别为技术产品。我们尝试添加“产品”功能并添加逗号分隔值,如上所示。但是模型只坚持sharepoint, visual- 基本上是单个词。它是无法识别短语。

在使用一些数据进行训练后,它能够将其识别sharepointvisual技术(实体),但是,所需的整个短语不起作用。

然后我们切换到简单的 RegEx 也(SharePoint)\s*(2013|2007|2010)非常简单。它仍然无法将其识别为单个短语。

有人可以帮我吗?

4

2 回答 2

1

快速更新...我能够正确地让模型理解“SharePoint 2013”​​整体上是一个产品。但是,在给出相同的上下文后,它无法预测不在“短语列表功能”中的任何其他产品。

我一直在用“我在 BizTalk 上工作”、“我在 SQL 上工作”进行培训......(所有单字母单词),一旦它开始正确预测单字母“技术/产品”。我给的话语为“我在 Sharepoint 2016 上工作”,然后它仅将“SharePoint”预测为产品。然后我添加了所有成功的单字产品,并连同它们一起给出了“SharePoint 2016”和宾果游戏......它奏效了。

到目前为止,一切都很好...

这是一个棘手的问题,现在模型对于上下文模式以及各种产品的命名方式已经非常稳定,我希望它能够预测“我在 Exchange 2016 上工作”,不幸的是它没有工作。它仅将“交换”单独预测为产品。然后我用相同的上下文(“我在 YYYY 工作”)用一些项目训练了很多。至少现在,模式匹配算法应该已经理解了模式。当给出“我在 Visual Studio 2016 上工作”的话语时,它未能预测到“Visual Studio 2016”是产品。它仅将“Visual Studio”预测为产品。现在请注意,在短语中我还添加了“Visual Studio”、“Visual Studio 2013”​​、“Visual Studio 2010” 并进行了培训,并且正在成功预测。为什么现在无法预测“Visual Studio 2016”是产品????我应该在短语列表中添加多少这样的产品?AI现在怎么样了?

想法是基于上下文和一些模式,它应该能够轻松预测其余的“产品”。我错过了什么???

于 2016-06-23T15:32:45.193 回答
0

我在 LUIS 中也遇到过类似的学习曲线。对于你想要的,你应该只使用一个简单的实体。我发现你必须为你想要的每个单词数量的变化训练至少 3 个话语。因此,如果您要选择的实体可以包含 1 到 5 个单词,则每个短语需要 15 个话语。这就是 15 个“我研究过这样那样”的短语。如果您还想要另一个短语,例如“我知道如何使用某某”,那么您还需要至少另外 15 个话语。简而言之,你需要大量的话语。而且我还经历过,如果您的实体混合了诸如“2017”或“三”之类的数字词,或者诸如“of”“the”“for”“in”等词,您可能需要额外的话语。



我在 2017 年
工作 我在 Visual Studio
工作 我在 Outlook 工作 2017
我在虚假应用程序
上工作 我在 Microsoft Visual Studio
工作 我在 2017 年 Word 文档
上工作 我在 Skype 上工作
我在 Google 地图计步器应用程序
上工作 我在 Visual Basic 上工作应用程序
我研究计算机 应用程序培训信息
我研究大小船帆
我研究一二三四五
我研究绿色 蓝色 红色 橙色 黄色

明白了吗?确保在每个话语中标记实体。

此外,如果您有相似但不同类型的短语,您可以使用 LUIS 的短语列表功能,而不是放入另外 15 个项目。因此,假设您还想要“我知道如何使用...”,只需创建一个名为“我工作过”之类的短语列表并添加短语列表,例如:

我工作
我知道如何使用
我擅长
我擅长
我擅长
我最擅长
......等等

于 2018-02-25T17:57:48.943 回答