0

我有一个存储在 word_dict 中的字典,我正在尝试使用下面描述的函数手动将文本转换为序列。但它继续抛出无值错误。我还通过仅应用数据集的一条记录来检查该功能,但它不适用于整个记录。

def tex_to_sequences():
  word_seq=[]
  doc = nlp(text)
  print(len(doc))
  print(word_seq)
  for t in doc:
    word_seq.append(word_dict.get(t.text))
  print(len(word_seq))
  return word_seq
df['sequences']= df['text'].apply(tex_to_sequences)

它显示第一条记录的输出,然后立即通过错误

4

1 回答 1

0

我们可以有你的数据框吗?

text_to_sequences 函数中的文本参数将代表 df['text'] 列?如果是这种情况,您必须向 text_to_sequences 函数添加另一个参数,例如 text_to_sequences(text,word_dict)

另外我建议您在应用中添加axis = 1,如下所示:

df['sequences']=df['text'].apply(text_to_sequences(word_dict),axis=1)
于 2021-11-14T10:54:59.820 回答