问题标签 [spacy-3]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

183 问题

0 投票

0 回答

75 浏览

text-classification - SpaCy 3.0 文本分类器

有人有使用 Spacy 3.0 文本分类器进行多类分类的经验吗？我目前有 6 个课程，在训练模型时，我的准确度得分全为零。代码正在工作，但如果有人遇到类似情况，我明天可以提供！将不胜感激我能得到的所有帮助！

text-classification spacy-3

2021-05-14T01:13:32.833

0 投票

1 回答

426 浏览

python - 在 spacy 3 中更新 ner 模型时出错，有什么建议吗？

我目前正在从fr_core_news_lg管道更新 NER 模型。当我最后一次使用它时，该代码大约在 1 或 2 个月前工作。但是现在，发生了一些事情，我不能再运行它了。我没有对代码进行任何更改，只是想再次运行它。但我收到以下错误：

错误指向我用新示例更新我的 NER 模型的代码部分：

单个训练示例，以便 NER 了解“咨询”是一个实体，如下所示：

我已将 SpaCy 更新到最新版本，并再次下载了fr_core_news_lg模型，甚至在新的 python 环境中尝试过，但无济于事。这让我觉得管道或 SpaCy 库发生了变化。谷歌搜索，我无法找到确切的答案。有人可以解决这个问题吗？

编辑：提供了更多细节。

2021-05-14T20:39:07.963

0 投票

1 回答

281 浏览

python - 需要帮忙！！！OSError：[E050] 找不到模型“en_core_web_trf”。它似乎不是 Python 包或数据目录的有效路径

我正在尝试在heroku中部署一个应用程序，它成功完成，但是当我单击查看应用程序时，它会在红色框中显示此错误！

OSError：[E050] 找不到模型“en_core_web_trf”。它似乎不是 Python 包或数据目录的有效路径。

这是我的代码

python heroku streamlit spacy-3

2021-05-18T04:22:38.010

0 投票

1 回答

212 浏览

nlp - Spacy - 使用具有两个不同数据集的两个可训练组件

我想知道是否可以使用两个不同的数据集在 Spacy 中训练两个可训练组件？事实上，我想使用 NER 和文本分类器，但是由于这两个组件的训练数据集应该以不同方式注释，所以我不知道如何同时训练这两个组件......

我应该在单独的管道中训练每个任务并在最后组装两个管道吗？或者我应该训练 NER，打包这个管道，然后使用这个包作为输入来训练文本分类器？

非常感谢您的帮助

nlp spacy spacy-3

2021-05-19T16:54:58.060

0 投票

1 回答

175 浏览

performance - 如何使用 spaCy v3 打印 NER 模型的 PRF 值？

语境

我目前正在为罗马尼亚法律领域研究 NER 模型。我开始使用 spaCy v2 (v2.2.4) 创建一个自定义模型，为此我成功地实现了一个代码来查找 PRF 值。现在，在我过渡到 spaCy v3 (v3.0.6) 之后，我发现很难评估我的模型的性能。

问题

我尝试执行以下操作：

在 spaCy v3.0.6 中使用相同的代码。就像 spaCy v2.2.4 一样（问题：spaCy v3.0.6 中不存在 GoldParser）
使用 spaCy v2.2.4 训练 v3.0.6 模型（问题：我认为无论版本如何，模型都不会以相同的方式保存）
使用 get_ner_prf() （问题：我不明白如何创建 Example 类型的参数，我也不知道如何调用该函数）

资源

这是我目前拥有的所有资源的列表：

v3.0.6 模型的配置文件（以及所有其他必要的文件）
以旧的 spaCy 格式训练和测试数据
为罗马尼亚语保存了 v3.0.6 自定义模型

要求

如果能收到适用于 spaCy v3.0.6 并计算 PRF 值的代码，我将不胜感激——最好是每种实体类型的单独结果。此外，如果代码仅使用上述资源，那就太好了。如果需要任何其他信息，我很乐意发送。

performance spacy-3

2021-05-23T09:46:52.280

0 投票

1 回答

87 浏览

spacy - 如何让 SpaCy 选择由“and”或“,”分隔的名词块作为一个

我很抱歉标题，我真的不知道如何表达它，但希望这个例子能说明清楚。

基本上，

对于下面的句子：

阿什利和布赖恩在喝水。

我希望名词块是“Ashley and Brian”而不是“Ashley”、“Brian”

另一个例子是：

衣服的种类包括衬衫、裤子和裤子。

我希望名词块是“衬衫、裤子和裤子”而不是“衬衫”“裤子”“裤子”

我该如何解决这个问题？

spacy spacy-3

2021-05-27T03:22:59.260

0 投票

2 回答

1716 浏览

attributes - AttributeError：模块“spacy”没有属性“load”

导入 spacy nlp = spacy.load('en_core_web_sm')

错误：回溯（最后一次调用）：

文件“C:\Users\PavanKumar.spyder-py3\ExcelML.py”，第 27 行，在 nlp = spacy.load('en_core_web_sm')

AttributeError：模块“spacy”没有属性“load”

谁能建议我一个解决方案？

attributes load attributeerror spacy-3

2021-05-31T06:42:15.277

0 投票

3 回答

522 浏览

python - 给定一个词，我们可以使用 Spacy 获得所有可能的引理吗？

输入词是独立的，不是句子的一部分，但我想获得它所有可能的引理，就好像输入词在具有所有可能 POS 标签的不同句子中一样。我还想获得单词引理的查找版本。

我为什么要这样做？

我已经从所有文档中提取了引理，并且我还计算了引理之间的依赖链接的数量。我已经使用en_core_web_sm. 现在，给定一个输入词，我想返回最常链接到输入词的所有可能词条的词条。

所以简而言之，我想token._lemma用所有可能的词性标签复制输入词的行为，以保持与我计算的引理链接的一致性。

python nlp spacy lemmatization spacy-3

2021-06-01T13:13:35.393

0 投票

1 回答

733 浏览

python - SpaCy 自定义 NER 训练 AttributeError：“DocBin”对象没有属性“to_disk”

我想使用 spaCy v3 训练一个自定义 NER 模型我准备了我的训练数据并使用了这个脚本

然后它打印这个错误：

python named-entity-recognition spacy-3

2021-06-13T09:36:33.787

0 投票

0 回答

81 浏览

python - SError: [E052] 运行 python exe 文件时找不到模型目录：en_core_web_sm [15484]

我能够为我的 python 代码创建一个 exe 文件，没有任何问题。

当我运行 exe 文件时，我遇到了一些包，如 srsly.msgpack.util 、 _custom_kernels.cu 和许多其他包，因为 pyInstaller 本身并没有安装所有需要的包。所以我经历了这个并创建了一个挂钩文件来解决这些问题。

hook.py 文件如下所示：

我还在我的 hook.py 文件中添加了“en_core_web_sm”，但看起来它没有下载“en_core_web_sm”所需的包。

我还尝试从我的 '\AppData\Local\Programs\Python\Python38\Lib\site-packages' 路径中手动添加 'en_core_web_sm' 文件夹。但它会抛出错误，说使用了第三方包。

当我尝试执行我的 exe 文件时出现以下错误。

Python 版本：3.8.10（64 位）

点子版本：21.1.2

pyinstaller 版本：5.0.dev0

请教如何解决这个问题，在此先感谢！

python pyinstaller executable spacy-3

2021-06-17T06:17:42.167

1 2 3 4 5 6 7 8 9 10

问题标签 [spacy-3]

语境

问题

资源

要求

Reference