我有一个存储在 word_dict 中的字典,我正在尝试使用下面描述的函数手动将文本转换为序列。但它继续抛出无值错误。我还通过仅应用数据集的一条记录来检查该功能,但它不适用于整个记录。
def tex_to_sequences():
word_seq=[]
doc = nlp(text)
print(len(doc))
print(word_seq)
for t in doc:
word_seq.append(word_dict.get(t.text))
print(len(word_seq))
return word_seq
df['sequences']= df['text'].apply(tex_to_sequences)