问题标签 [srl]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
riscv - 如何在 RISCV 中使用环绕进行逻辑转换?
在进行左移或右移时,我想用回绕添加丢失的位。我怎样才能做到这一点?
python - 语义角色标签张量问题
我在 df.sentence 列中有一个数据框有很长的句子。我正在尝试使用语义角色标签提取 arg0 并将 arg0 保存在单独的列中。
我不断收到此错误:
这是我的代码:
我想我应该在这里创建一个可以跳过而不是抛出错误的新代码行,并添加 df.arg0 'failed' .. 等等。我的方法对吗?如果是这样,关于如何在我的代码中添加该行的任何想法?如果没有,任何建议将不胜感激。
注意:我认为最合适的方法是继续使用 longformer。我还检查了 longformer 的任何方法,找不到任何方法。我也将不胜感激对此的任何建议。
我也试过
我的数据示例:
bert-language-model - 如何在 AllenNLP 中将基于 AllenNLP BERT 的语义角色标签更改为 RoBERTa
目前我可以使用下面的配置文件训练语义角色标签模型。此配置文件基于AllenNLP 提供的配置文件,适用于默认bert-base-uncased
模型,也适用于GroNLP/bert-base-dutch-cased
.
由于 SRL 数据读取器仅支持 BertTokenizer而不支持 RobertaTokenizer,因此将的值bert_model_name
和bert_model
参数从交换GroNLP/bert-base-dutch-cased
到开箱即用是行不通的。所以我将配置文件更改为以下内容:roberta-base
但是,这仍然不起作用。我收到以下错误:
我不完全理解出了什么问题,也找不到任何有关如何更改配置文件以加载“自定义”BERT/RoBERTa 模型(此处未提及的模型)的文档。我正在运行默认allennlp train config.jsonnet
命令来开始训练。allennlp train config.jsonnet --dry-run
但是不会产生错误。
提前致谢!蒂斯
编辑: 我现在已经换掉并继承了自定义“srl_roberta”类的“srl_bert”,以使用RobertaModel。然而,这仍然会产生相同的错误。
EDIT2:我现在正在使用 Dirk Groeneveld 建议的 AutoTokenizer。更改 SrlReader 类以支持基于 RoBERTa 的模型似乎涉及更多更改,例如将 BERT 的 wordpiece 标记器交换为 RoBERTa 的 BPE 标记器。有没有一种简单的方法来适应 SrlReader 类,还是从头开始编写一个新的 RobertaSrlReader 更好?
我继承了 SrlReader 类并将这一行更改为以下内容:
由于 RoBERTa 标记化与 BERT 不同,它会产生以下错误: