我目前正在开发一个模型,使用Keras
+Tensorflow
来计算基于 STS 基准(http://ixa2.si.ehu.es/stswiki/index.php/STSbenchmark)的句子相似度。我是如何做到的,我首先创建了一个预训练模型,该模型将单词嵌入向量列表转换为单个句子嵌入向量。现在,我想做的是将这个预训练模型合并到一个新模型中,该模型使用这个模型来转换输入。以下是该新模型的代码。
sentence_encoder = load_model('path/to/model')
input1 = Input(shape=(30, 300), dtype='float32') # 30 words, 300 dim embedding
input2 = Input(shape=(30, 300), dtype='float32')
x1 = sentence_encoder(input1)
x2 = sentence_encoder(input2)
abs_diff = Lambda(lambda x: abs(x[0] - x[1]))([x1, x2])
x = Dense(300, activation='relu', kernel_initializer='he_uniform')(abs_diff)
result = Dense(1, activation='sigmoid')(x)
model = Model([input1, input2], result)
model.compile(loss='binary_crossentropy',
optimizer='rmsprop',
metrics=['accuracy'])
model.fit(...)
当我运行它时,会生成一个模型并正确完成。然而,我想知道的是,是否sentence_encoder
与这个新模型一起训练或者它的权重是否保持不变?如果可能的话,我希望sentence_encoder
's 的权重受到这个新模型的训练的影响。如果这没有实现,我该怎么做呢?
先感谢您!