我想使用 Tensorflow Dataset api 使用 tensorflow Hub 初始化我的数据集。我想使用 dataset.map 函数将我的文本数据转换为嵌入。我的 TensorFlow 版本是 1.14。
由于我使用了 elmo v2 模块,它将一堆句子数组转换为它们的词嵌入,因此我使用了以下代码:
import tensorflow as tf
import tensorflow_hub as hub
...
sentences_array = load_sentences()
#Sentence_array=["I love Python", "python is a good PL"]
def parse(sentences):
elmo = hub.Module("./ELMO")
embeddings = elmo([sentences], signature="default", as_dict=True)
["word_emb"]
return embeddings
dataset = tf.data.TextLineDataset(sentences_array)
dataset = dataset.apply(tf.data.experimental.map_and_batch(map_func =
parse, batch_size=batch_size))
我想要嵌入文本数组,如 [batch_size, max_words_in_batch, embedding_size],但我收到一条错误消息:
"NotImplementedError: Using TF-Hub module within a TensorFlow defined
function is currently not supported."
我怎样才能得到预期的结果?