问题标签 [spacy-3]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
75 浏览

text-classification - SpaCy 3.0 文本分类器

有人有使用 Spacy 3.0 文本分类器进行多类分类的经验吗?我目前有 6 个课程,在训练模型时,我的准确度得分全为零。代码正在工作,但如果有人遇到类似情况,我明天可以提供!将不胜感激我能得到的所有帮助!

0 投票
1 回答
426 浏览

python - 在 spacy 3 中更新 ner 模型时出错,有什么建议吗?

我目前正在从fr_core_news_lg管道更新 NER 模型。当我最后一次使用它时,该代码大约在 1 或 2 个月前工作。但是现在,发生了一些事情,我不能再运行它了。我没有对代码进行任何更改,只是想再次运行它。但我收到以下错误:

错误指向我用新示例更新我的 NER 模型的代码部分:

单个训练示例,以便 NER 了解“咨询”是一个实体,如下所示:

我已将 SpaCy 更新到最新版本,并再次下载了fr_core_news_lg模型,甚至在新的 python 环境中尝试过,但无济于事。这让我觉得管道或 SpaCy 库发生了变化。谷歌搜索,我无法找到确切的答案。有人可以解决这个问题吗?

编辑:提供了更多细节。

0 投票
1 回答
281 浏览

python - 需要帮忙!!!OSError:[E050] 找不到模型“en_core_web_trf”。它似乎不是 Python 包或数据目录的有效路径

我正在尝试在heroku中部署一个应用程序,它成功完成,但是当我单击查看应用程序时,它会在红色框中显示此错误!

OSError:[E050] 找不到模型“en_core_web_trf”。它似乎不是 Python 包或数据目录的有效路径。

这是我的代码

0 投票
1 回答
212 浏览

nlp - Spacy - 使用具有两个不同数据集的两个可训练组件

我想知道是否可以使用两个不同的数据集在 Spacy 中训练两个可训练组件?事实上,我想使用 NER 和文本分类器,但是由于这两个组件的训练数据集应该以不同方式注释,所以我不知道如何同时训练这两个组件......

我应该在单独的管道中训练每个任务并在最后组装两个管道吗?或者我应该训练 NER,打包这个管道,然后使用这个包作为输入来训练文本分类器?

非常感谢您的帮助

0 投票
1 回答
175 浏览

performance - 如何使用 spaCy v3 打印 NER 模型的 PRF 值?

语境

我目前正在为罗马尼亚法律领域研究 NER 模型。我开始使用 spaCy v2 (v2.2.4) 创建一个自定义模型,为此我成功地实现了一个代码来查找 PRF 值。现在,在我过渡到 spaCy v3 (v3.0.6) 之后,我发现很难评估我的模型的性能。

问题

我尝试执行以下操作:

  • 在 spaCy v3.0.6 中使用相同的代码。就像 spaCy v2.2.4 一样(问题:spaCy v3.0.6 中不存在 GoldParser)
  • 使用 spaCy v2.2.4 训练 v3.0.6 模型(问题:我认为无论版本如何,模型都不会以相同的方式保存)
  • 使用 get_ner_prf() (问题:我不明白如何创建 Example 类型的参数,我也不知道如何调用该函数)

资源

这是我目前拥有的所有资源的列表:

  • v3.0.6 模型的配置文件(以及所有其他必要的文件)
  • 以旧的 spaCy 格式训练和测试数据
  • 为罗马尼亚语保存了 v3.0.6 自定义模型

要求

如果能收到适用于 spaCy v3.0.6 并计算 PRF 值的代码,我将不胜感激——最好是每种实体类型的单独结果。此外,如果代码仅使用上述资源,那就太好了。如果需要任何其他信息,我很乐意发送。

0 投票
1 回答
87 浏览

spacy - 如何让 SpaCy 选择由“and”或“,”分隔的名词块作为一个

我很抱歉标题,我真的不知道如何表达它,但希望这个例子能说明清楚。

基本上,

对于下面的句子:

阿什利和布赖恩在喝水。

我希望名词块是“Ashley and Brian”而不是“Ashley”、“Brian”

另一个例子是:

衣服的种类包括衬衫、裤子和裤子。

我希望名词块是“衬衫、裤子和裤子”而不是“衬衫”“裤子”“裤子”

我该如何解决这个问题?

0 投票
2 回答
1716 浏览

attributes - AttributeError:模块“spacy”没有属性“load”

导入 spacy nlp = spacy.load('en_core_web_sm')

错误:回溯(最后一次调用):

文件“C:\Users\PavanKumar.spyder-py3\ExcelML.py”,第 27 行,在 nlp = spacy.load('en_core_web_sm')

AttributeError:模块“spacy”没有属性“load”

谁能建议我一个解决方案?

0 投票
3 回答
522 浏览

python - 给定一个词,我们可以使用 Spacy 获得所有可能的引理吗?

输入词是独立的,不是句子的一部分,但我想获得它所有可能的引理,就好像输入词在具有所有可能 POS 标签的不同句子中一样。我还想获得单词引理的查找版本。

我为什么要这样做?

我已经从所有文档中提取了引理,并且我还计算了引理之间的依赖链接的数量。我已经使用en_core_web_sm. 现在,给定一个输入词,我想返回最常链接到输入词的所有可能词条的词条。

所以简而言之,我想token._lemma用所有可能的词性标签复制输入词的行为,以保持与我计算的引理链接的一致性。

0 投票
1 回答
733 浏览

python - SpaCy 自定义 NER 训练 AttributeError:“DocBin”对象没有属性“to_disk”

我想使用 spaCy v3 训练一个自定义 NER 模型我准备了我的训练数据并使用了这个脚本

然后它打印这个错误:

0 投票
0 回答
81 浏览

python - SError: [E052] 运行 python exe 文件时找不到模型目录:en_core_web_sm [15484]

我能够为我的 python 代码创建一个 exe 文件,没有任何问题。

当我运行 exe 文件时,我遇到了一些包,如 srsly.msgpack.util 、 _custom_kernels.cu 和许多其他包,因为 pyInstaller 本身并没有安装所有需要的包。所以我经历了这个并创建了一个挂钩文件来解决这些问题。

hook.py 文件如下所示:

我还在我的 hook.py 文件中添加了“en_core_web_sm”,但看起来它没有下载“en_core_web_sm”所需的包。

我还尝试从我的 '\AppData\Local\Programs\Python\Python38\Lib\site-packages' 路径中手动添加 'en_core_web_sm' 文件夹。但它会抛出错误,说使用了第三方包。

当我尝试执行我的 exe 文件时出现以下错误。 在此处输入图像描述

Python 版本:3.8.10(64 位)

点子版本:21.1.2

pyinstaller 版本:5.0.dev0

请教如何解决这个问题,在此先感谢!