我有几句话如下
what is the sales org for fpc 1234 for IS?
give me sales org for fpc 12234 for IS?
give me sales org for fpc 12234 with scope ME?
在上面的句子中,我正在寻找的实体分别是IS
,IS
和ME
。这些实体包括 、IS
、ME
、AN
,AM
它们在用英语构建句子时很常见。我LUIS
用于实体检测并将实体维护为列表实体。问题是,虽然LUIS
能够检测到实体(IS
, AN
, AM
),但它可以在正常句子中检测到它们,例如
what is the sales org for fpc 1234
在上面的句子中,我们没有任何实体,但实体IS
被拾取。
我们如何仅在实体被实际处理而不是句子结构的一部分时才检测它们。
需要注意的几点:
- 实体列表真的很长,用来训练实体而不是使用实体
- 我们不能硬编码来查找实体的两次出现,因为它可能会失败,如下所示:
give me sales org for fpc 12234 for IS?
ME,IS
不会出现两次,也不能用于创建规则。
- 问题一般不在于
LUIS
实体提取,而在于实体提取。我也在研究POS
标记,但这需要实体以大写字母出现才能将其识别为名词,但情况可能并非总是如此。