问题标签 [named-entity-extraction]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
599 浏览

tensorflow - Rasa 查找表在训练数据中引发错误 - “不是有效的 NLU 数据”

我正在使用 RASA 构建一个天气机器人,并希望我的模型能够将位置提取为实体。我的模型无法识别训练数据之外的位置。所以,我决定为其他实体使用查找表。

我按照博客文章使用查找表进行实体提取并使用查找表通过在数据文件夹下创建查找“.txt”文件来识别训练数据中的位置实体。

这就是我的训练数据的样子:

我的查找表有一个新行中的每个位置的名称。

但是,当我运行“rasa train nlu”时,出现以下错误:“路径“数据”中不包含有效的 NLU 数据。请验证数据格式。现在将跳过 NLU 模型训练。 ”可能是什么原因 ?我只做了博客里说的。请告诉我哪里出错了。提前致谢

0 投票
1 回答
713 浏览

python - 空间训练模型

我想创建自己的 spacy 训练模型。使用我的以下代码,我收到错误。

我收到以下错误,当我在此站点https://spacy.io/usage/training上使用简单的训练循环时,我没有得到它的工作原理

输出:

谁能帮助我为什么会收到此错误?

0 投票
1 回答
113 浏览

python - 如何从手动训练的 spacy 模型中进行预测

我有以下代码来创建和训练一个新的 spacy 模型。我不知道如何从新文本中预测实体?

有人可以帮忙吗?

0 投票
1 回答
302 浏览

rasa - 翻译 NLU 模型中 RASA 实体提取的问题

我是 RASA 框架的新手。我正在尝试开发一个西班牙 NLU 模型,该模型能够以 4 种不同的意图(“翻译”、“定义”、“同义词”和“发音”)对用户消息进行分类并识别实体(在这种情况下,我的实体可能是每个单词或表达)。

例如,用户可以提供以下输入:

“Cómo se traduce estación de tren al inglés”(如何将火车站翻译成英文)

所以这个词或表达可以是任何一个或多个词,它们可以有任何长度。解决这个问题的最佳方法是什么?我可以使用什么实体提取器,我应该尝试什么参数?

提前致谢!

0 投票
4 回答
922 浏览

rasa-nlu - 如何处理 Rasa NLU 实体提取中的拼写错误(错别字)?

我的训练集(nlu_data.md 文件)中几乎没有意图,每个意图下都有足够数量的训练示例。下面是一个例子,

##intent: SEARCH_HOTEL
- find good [hotel](place) for me in Mumbai

我已经添加了多个这样的句子。在测试时,训练文件中的所有句子都可以正常工作。但是,如果任何输入查询有拼写错误,例如酒店关键字的 hotol/hetel/hotele,那么 Rasa NLU 无法将其提取为实体。

我想解决这个问题。我只能更改训练数据,也不能为此编写任何自定义组件。

0 投票
1 回答
185 浏览

google-cloud-automl - 如何在 Google Auto ML 自然语言实体提取中重命名实体提取标签?

在 Google Auto ML Natural Language Entity Extraction 中,将鼠标悬停在标签上时,它会显示“重命名或删除项目”选项,但在实际单击设置时,我只能选择删除标签。我在其中一个标签上犯了拼写错误。

重命名和删除项目选项

仅提供删除选项

0 投票
0 回答
55 浏览

google-cloud-platform - 如何使用医疗实体提取作为基础模型制作 Automl 模型?

使用 Automl 制作自定义模型时遇到问题。我正在为 Automl 提供带有标签DISEASE的 JSONL 训练数据。

我的服务帐户具有权限Healthcare.nlpservce.analyzeEntities并且在开始培训之前我选择了启用医疗保健实体提取的选项。在此处输入图像描述

但经过 4 个多小时的训练后,模型仍然只检测到DISEASE标签。它没有检测到问题、程序

我正在按照文档中提到的步骤进行操作

附服务账号权限照片(无使用分析)没有使用分析[?]

谁能指出我正确的方向....

0 投票
1 回答
202 浏览

python - 使用 SpaCy 和 python lambda 提取命名实体

我正在使用以下代码使用 lambda 提取命名实体。

对于几百条记录,它可以提取结果。但是当涉及到数千条记录时。这需要很长时间。有人可以帮我优化这行代码吗?

0 投票
1 回答
79 浏览

pandas - 拼音命名实体识别

我正在尝试进行命名实体识别或从拼音或汉字的罗马化中提取人物,地点等。

例如(来自维基百科):

我希望从上面提取实体,例如:

汉字NER很复杂,但我不知道提取拼音的方法。

我目前的计划是尝试 1300 多个汉字的所有排列,如下所示:

然后,我打算将 .isin()文本数据与拼音列表进行比较。

有谁知道提取实体拼音的更好方法?

0 投票
1 回答
107 浏览

nlp - 方面级实体提取和情感分析

我正在研究自然语言处理,并且很难分析某些实体的情绪值。例如,如果我说:“我喜欢我终于要离开芝加哥这一事实”,它表示该句子是一个肯定句。但正如您所看到的,它对于实体“芝加哥”来说是非常负面的。有谁知道这方面有没有相关的工作?提前致谢