0

所以我尝试用 EmoRoBERTA 进行情绪分类,但是,我的数据中的一些字符串超过了 512 个标记的限制。有没有办法增加这个限制?我在某处读到有关设置max_length = 1024但不确定这是否有效?

我正在使用这个库 -

from transformers import RobertaTokenizerFast, TFRobertaForSequenceClassification, pipeline
tokenizer = RobertaTokenizerFast.from_pretrained("arpanghoshal/EmoRoBERTa")
model = TFRobertaForSequenceClassification.from_pretrained("arpanghoshal/EmoRoBERTa")
4

0 回答 0