问题标签 [spacy-3]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
text-classification - SpaCy 3.0 文本分类器
有人有使用 Spacy 3.0 文本分类器进行多类分类的经验吗?我目前有 6 个课程,在训练模型时,我的准确度得分全为零。代码正在工作,但如果有人遇到类似情况,我明天可以提供!将不胜感激我能得到的所有帮助!
python - 在 spacy 3 中更新 ner 模型时出错,有什么建议吗?
我目前正在从fr_core_news_lg
管道更新 NER 模型。当我最后一次使用它时,该代码大约在 1 或 2 个月前工作。但是现在,发生了一些事情,我不能再运行它了。我没有对代码进行任何更改,只是想再次运行它。但我收到以下错误:
错误指向我用新示例更新我的 NER 模型的代码部分:
单个训练示例,以便 NER 了解“咨询”是一个实体,如下所示:
我已将 SpaCy 更新到最新版本,并再次下载了fr_core_news_lg
模型,甚至在新的 python 环境中尝试过,但无济于事。这让我觉得管道或 SpaCy 库发生了变化。谷歌搜索,我无法找到确切的答案。有人可以解决这个问题吗?
编辑:提供了更多细节。
python - 需要帮忙!!!OSError:[E050] 找不到模型“en_core_web_trf”。它似乎不是 Python 包或数据目录的有效路径
我正在尝试在heroku中部署一个应用程序,它成功完成,但是当我单击查看应用程序时,它会在红色框中显示此错误!
OSError:[E050] 找不到模型“en_core_web_trf”。它似乎不是 Python 包或数据目录的有效路径。
这是我的代码
nlp - Spacy - 使用具有两个不同数据集的两个可训练组件
我想知道是否可以使用两个不同的数据集在 Spacy 中训练两个可训练组件?事实上,我想使用 NER 和文本分类器,但是由于这两个组件的训练数据集应该以不同方式注释,所以我不知道如何同时训练这两个组件......
我应该在单独的管道中训练每个任务并在最后组装两个管道吗?或者我应该训练 NER,打包这个管道,然后使用这个包作为输入来训练文本分类器?
非常感谢您的帮助
performance - 如何使用 spaCy v3 打印 NER 模型的 PRF 值?
语境
我目前正在为罗马尼亚法律领域研究 NER 模型。我开始使用 spaCy v2 (v2.2.4) 创建一个自定义模型,为此我成功地实现了一个代码来查找 PRF 值。现在,在我过渡到 spaCy v3 (v3.0.6) 之后,我发现很难评估我的模型的性能。
问题
我尝试执行以下操作:
- 在 spaCy v3.0.6 中使用相同的代码。就像 spaCy v2.2.4 一样(问题:spaCy v3.0.6 中不存在 GoldParser)
- 使用 spaCy v2.2.4 训练 v3.0.6 模型(问题:我认为无论版本如何,模型都不会以相同的方式保存)
- 使用 get_ner_prf() (问题:我不明白如何创建 Example 类型的参数,我也不知道如何调用该函数)
资源
这是我目前拥有的所有资源的列表:
- v3.0.6 模型的配置文件(以及所有其他必要的文件)
- 以旧的 spaCy 格式训练和测试数据
- 为罗马尼亚语保存了 v3.0.6 自定义模型
要求
如果能收到适用于 spaCy v3.0.6 并计算 PRF 值的代码,我将不胜感激——最好是每种实体类型的单独结果。此外,如果代码仅使用上述资源,那就太好了。如果需要任何其他信息,我很乐意发送。
spacy - 如何让 SpaCy 选择由“and”或“,”分隔的名词块作为一个
我很抱歉标题,我真的不知道如何表达它,但希望这个例子能说明清楚。
基本上,
对于下面的句子:
阿什利和布赖恩在喝水。
我希望名词块是“Ashley and Brian”而不是“Ashley”、“Brian”
另一个例子是:
衣服的种类包括衬衫、裤子和裤子。
我希望名词块是“衬衫、裤子和裤子”而不是“衬衫”“裤子”“裤子”
我该如何解决这个问题?
attributes - AttributeError:模块“spacy”没有属性“load”
导入 spacy nlp = spacy.load('en_core_web_sm')
错误:回溯(最后一次调用):
文件“C:\Users\PavanKumar.spyder-py3\ExcelML.py”,第 27 行,在 nlp = spacy.load('en_core_web_sm')
AttributeError:模块“spacy”没有属性“load”
谁能建议我一个解决方案?
python - 给定一个词,我们可以使用 Spacy 获得所有可能的引理吗?
输入词是独立的,不是句子的一部分,但我想获得它所有可能的引理,就好像输入词在具有所有可能 POS 标签的不同句子中一样。我还想获得单词引理的查找版本。
我为什么要这样做?
我已经从所有文档中提取了引理,并且我还计算了引理之间的依赖链接的数量。我已经使用en_core_web_sm
. 现在,给定一个输入词,我想返回最常链接到输入词的所有可能词条的词条。
所以简而言之,我想token._lemma
用所有可能的词性标签复制输入词的行为,以保持与我计算的引理链接的一致性。
python - SpaCy 自定义 NER 训练 AttributeError:“DocBin”对象没有属性“to_disk”
我想使用 spaCy v3 训练一个自定义 NER 模型我准备了我的训练数据并使用了这个脚本
然后它打印这个错误:
python - SError: [E052] 运行 python exe 文件时找不到模型目录:en_core_web_sm [15484]
我能够为我的 python 代码创建一个 exe 文件,没有任何问题。
当我运行 exe 文件时,我遇到了一些包,如 srsly.msgpack.util 、 _custom_kernels.cu 和许多其他包,因为 pyInstaller 本身并没有安装所有需要的包。所以我经历了这个并创建了一个挂钩文件来解决这些问题。
hook.py 文件如下所示:
我还在我的 hook.py 文件中添加了“en_core_web_sm”,但看起来它没有下载“en_core_web_sm”所需的包。
我还尝试从我的 '\AppData\Local\Programs\Python\Python38\Lib\site-packages' 路径中手动添加 'en_core_web_sm' 文件夹。但它会抛出错误,说使用了第三方包。
Python 版本:3.8.10(64 位)
点子版本:21.1.2
pyinstaller 版本:5.0.dev0
请教如何解决这个问题,在此先感谢!