我有一个句子列表。我想为它们添加填充;但是当我像这样使用 keras pad_sequence 时:
from keras.preprocessing.sequence import pad_sequences
s = [["this", "is", "a", "book"], ["this", "is", "not"]]
g = pad_sequences(s, dtype='str', maxlen=10, value='_PAD_')
结果是:
array([['_', '_', '_', '_', '_', '_', 't', 'i', 'a', 'b'],
['_', '_', '_', '_', '_', '_', '_', 't', 'i', 'n']], dtype='<U1')
为什么它不能正常工作?
我想将此结果用作 ELMO 嵌入的输入,并且我需要字符串句子而不是整数编码。