基本上我正在尝试使用自定义风格语言模型来将单词或句子嵌入向量中。这是可能的,还是只有在使用天赋 NER 模型时才能使用天赋嵌入?
当使用嵌入 .embed() 函数时,我会收到类似“[Sentence: "pain" [− Tokens: 1]]" 的输出,因为我正在寻找连续数字的向量。
谢谢你。
我很困惑,因为天赋作者自己有一个关于词嵌入的官方教程,它似乎完全涵盖了这个主题。我想问题是您将处理后的句子对象.embed()
与所述对象的实际.embedding
属性混淆了。
在任何情况下,您都可以像这样简单地迭代单个标记的词嵌入(取自上面提到的教程):
from flair.embeddings import WordEmbeddings
from flair.data import Sentence
# init embedding
glove_embedding = WordEmbeddings('glove')
# create sentence.
sentence = Sentence('The grass is green .')
# embed a sentence using glove.
glove_embedding.embed(sentence)
# now check out the embedded tokens.
for token in sentence:
print(token)
print(token.embedding)
我对天赋不够熟悉,不知道您是否可以将其应用于任意字符序列,但它对我来说适用于标记。