问题标签 [deeppavlov]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
deep-learning - DeepPavlov 对自己的反应进行排名
有谁知道,如何使用带有自己响应的 deeppavlov 排名模块?文档(http://docs.deeppavlov.ai/en/master/components/neural_ranking.html)提供以下代码(用于保险数据集):
但是当我将此代码用于 ubuntu 数据集时:
原来没有rebuilt_responces
方法:
有任何想法吗?
python - 我如何在 DeepPavlov 分类器中获得概率?
我使用 DeepPavlov 训练我的分类器,然后当我为某些样本函数调用训练模型时,只返回一个类标签,但我想获得每个类的概率。我没有找到可以让我获得概率的函数参数。有没有人遇到过这样的问题?感谢!
我想要具有类长度的 np.array 之类的输出,但当前输出是一个标签,例如 ['PlayMusic']。
machine-learning - 无法导入名称“convert_examples_to_features”deeppavlov
我试图从 deeppavlov 的关于 NER 的教程中运行代码片段。
首先我运行命令:
然后
抓住这个错误:
因此,如果在 VSCode 中粘贴代码,则行
会给出一个信号“'Struct'的实例没有'ner'成员”
(配置是结构)
我该如何解决?谷歌没有找到答案
python - Deeppavlov - 制作自定义意图
大家好 - 我可以使用上面 deeppavlov 的预训练模型对预先创建的意图进行意图分类。但是,我想使用 deeppavlov 用我自己的意图和自己的文本创建自己的意图分类模型。总共将有 5 到 7 个意图。
我该怎么做呢?
即我得到的带有文本和意图的样本数据
bert-language-model - NER的deeppavlov训练一直失败
我一直在尝试根据他们文档上给出的训练语法为 NER 训练 deeppavlov 模型,但它一直失败,并显示以下错误消息:
使用以下代码训练 deeppavlov 模型,它似乎正在处理他们的样本数据集,但是当我根据他们的训练样本指南创建自己的数据集时,我不断收到上述错误消息。训练ner代码:
输入 train.txt 文件:
python-3.x - 在 Windows 上运行 rubert 训练时出错
当我开始训练 rubert 时,会返回此消息。
我什至无法猜测出了什么问题...
模型 = train_model(config_path) 2021-01-03 18:41:46.694 第 112 行的“deeppavlov.dataset_readers.basic_classification_reader”[“basic_classification_reader”] 中的警告:找不到 E:\NTI\valid.csv 文件 2021-01-03 18:41:47.646 INFO in 'deeppavlov.dataset_iterators.basic_classification_iterator'['basic_classification_iterator'] 在第 74 行:将字段 <> 拆分为新字段 <<['train', 'valid']>> [nltk_data] 下载包 punkt 到[nltk_data]
C:\Users\SAM\AppData\Roaming\nltk_data... [nltk_data] 包 punkt 已经是最新的了![nltk_data] 正在将包停用词下载到 [nltk_data] C:\Users\SAM\AppData\Roaming\nltk_data... [nltk_data] 包停用词已经是最新的![nltk_data] 下载包 perluniprops 到 [nltk_data]
C:\Users\SAM\AppData\Roaming\nltk_data... [nltk_data] 包 perluniprops 已经是最新的了![nltk_data] 正在将包 nonbreaking_prefixes 下载到 [nltk_data]
C:\Users\SAM\AppData\Roaming\nltk_data... [nltk_data] 包 nonrupting_prefixes 已经是最新的了!E:\Anaconda\lib\site-packages\h5py_ init _.py:40: UserWarning: h5py is running against HDF5 1.10.5 when it is built on 1.10.4, 这可能会导致问题
'{0}。{1} .{2}'.format(*version.hdf5_built_version_tuple) 警告! HDF5 库版本不匹配错误用于编译此应用程序的 HDF5 头文件与此应用程序链接到的 HDF5 库使用的版本不匹配。如果应用程序继续,可能会发生数据损坏或分段错误。当应用程序由一个版本的 HDF5 编译但与不同版本的静态或共享 HDF5 库链接时,可能会发生这种情况。您应该重新编译应用程序或检查与共享库相关的设置,例如“LD_LIBRARY_PATH”。您可以通过将环境变量“HDF5_DISABLE_VERSION_CHECK”设置为“1”来禁用此警告,风险自负。将其设置为 2 或更高将完全抑制警告消息。标头是 1.10.4,库是 1.10.5 HDF5 配置摘要 =================================
一般信息:
编译选项:
链接选项:
静态链接的可执行文件:关闭 LDFLAGS:/machine:x64 H5_LDFLAGS:AM_LDFLAGS:额外库:存档器:Ranlib:
语言:
特征:
提前致谢!
pandas - 拼音命名实体识别
我正在尝试进行命名实体识别或从拼音或汉字的罗马化中提取人物,地点等。
例如(来自维基百科):
我希望从上面提取实体,例如:
汉字NER很复杂,但我不知道提取拼音的方法。
我目前的计划是尝试 1300 多个汉字的所有排列,如下所示:
然后,我打算将
.isin()
文本数据与拼音列表进行比较。
有谁知道提取实体拼音的更好方法?
jupyter-notebook - TypeError: stat: path 应该是字符串、字节、os.PathLike 或整数,而不是 TrainingResult
这是我的代码:
它给出了错误:
2 3 个端点中的 TypeError Traceback(最近一次通话最后一次)=“endpoints.yml”----> 4 聊天(模型路径,端点)
C:\anaconda\envs\newrasa\lib\site-packages\rasa\jupyter.py in chat(model_path, endpoints, agent, interpreter) 35 from rasa.run import create_agent 36 ---> 37 agent = create_agent(model_path,端点)38 39 elif 代理不是无,解释器不是无:
C:\anaconda\envs\newrasa\lib\site-packages\rasa\run.py in create_agent(model, endpoints) 72 _lock_store = LockStore.create(_endpoints.lock_store) 73 ---> 74 return Agent.load(75模型,76 生成器=_endpoints.nlg,
C:\anaconda\envs\newrasa\lib\site-packages\rasa\core\agent.py 加载(cls,model_path,解释器,生成器,tracker_store,lock_store,action_endpoint,model_server,remote_storage,path_to_model_archive,new_config,finetuning_epoch_fraction)414 if not model_path: 415 raise ModelNotFound("No path specified.") --> 416 if not os.path.exists(model_path): 417 raise ModelNotFound(f"No file or directory at '{model_path}'.") 418如果 os.path.isfile(model_path):
C:\anaconda\envs\newrasa\lib\genericpath.py in exists(path) 17 """测试路径是否存在。为损坏的符号链接返回 False""" 18 try: ---> 19 os.stat( path) 20 except (OSError, ValueError): 21 return False
TypeError: stat: path 应该是字符串、字节、os.PathLike 或整数,而不是 TrainingResult
nlp - deeppavlov 模型火车没有找到模块
我正在尝试在 GoogleColab 上开始 deeppavlov 模型训练:
并得到错误:
我的代码基于http://docs.deeppavlov.ai/en/master/features/models/squad.html。
请帮我解决这个问题
python - UFuncTypeError: ufunc 'clip' 不包含具有签名匹配类型的循环 (dtype('<U32'), dtype('<U32'), dtype('<U32')) -> dtype('<U32')
我使用 Deep Pavlov 框架与 Bert 分类器一起工作,只是因为我需要预测人员的语言是俄语。基本上,我正在尝试解决多类分类问题。根据 Deep Pavlov,我们可以轻松地更改配置文件上的一些配置。我拿了这个配置文件https://github.com/deepmipt/DeepPavlov/blob/master/deeppavlov/configs/classifiers/rusentiment_convers_bert.json并训练了它,我花了大约 13 个小时才完成,结果是这样我的模型过拟合。
我做了一些改变,尤其是这些:
另外,我增加了批量大小,之前是 16:
并添加了一些指标:
还将validation_patience更改为1并添加了tensorboard func
就是这样。这些是我对模型所做的所有更改,当我尝试训练我的模型时,它给了我以下错误:
起初,我认为它与数据集有关,但是,我没有更改我的数据集,并且在我第一次训练这个模型时它已经运行了。