我希望使用 Allen NLP Interpret 进行集成可视化和显着性映射。在自定义变压器模型上,你能告诉我怎么做吗?
问问题
322 次
1 回答
5
这可以通过在您的自定义模型周围使用 AllenNLP 包装器来完成。解释模块需要一个 Predictor 对象,因此您可以编写自己的或使用现有的。
以下是分类模型的示例:
from allennlp.data.vocabulary import Vocabulary
from allennlp.predictors.text_classifier import TextClassifierPredictor
from allennlp.data.dataset_readers import TextClassificationJsonReader
import torch
class ModelWrapper(Model):
def __init__(self, vocab, your_model):
super().__init__(vocab)
self.your_model = your_model
self.logits_to_probs = torch.nn.Softmax()
self.loss = torch.nn.CrossEntropyLoss()
def forward(self, tokens, label=None):
if label is not None:
outputs = self.your_model(tokens, label=label)
else:
outputs = self.your_model(tokens)
probs = self.logits_to_probs(outputs["logits"])
if label is not None:
loss = self.loss(outputs["logits"], label)
outputs["loss"] = loss
outputs["probs"] = probs
return outputs
您的自定义变压器模型可能没有可识别的TextFieldEmbedder
. 这是模型的初始嵌入层,针对显着性解释器计算梯度。这些可以通过覆盖预测器中的以下方法来指定。
class PredictorWrapper(TextClassifierPredictor):
def get_interpretable_layer(self):
return self._model.model.bert.embeddings.word_embeddings # This is the initial layer for huggingface's `bert-base-uncased`; change according to your custom model.
def get_interpretable_text_field_embedder(self):
return self._model.model.bert.embeddings.word_embeddings
predictor = PredictorWrapper(model=ModelWrapper(vocab, your_model),
dataset_reader=TextClassificationJsonReader())
现在你有一个 AllenNLP 预测器,它可以与解释模块一起使用,如下所示:
from allennlp.interpret.saliency_interpreters import SimpleGradient
interpreter = SimpleGradient(predictor)
interpreter.saliency_interpret_from_json({"sentence": "This is a good movie."})
这应该为您提供关于每个输入标记的梯度。
于 2021-01-29T08:42:54.157 回答