5

我正在关注本教程:https ://huggingface.co/transformers/torchscript.html 来创建我的自定义 BERT 模型的跟踪,但是在运行完全相同时dummy_input我收到错误:

TracerWarning: Converting a tensor to a Python boolean might cause the trace to be incorrect. 
We cant record the data flow of Python values, so this value will be treated as a constant in the future. 

在我的模型和标记器中加载后,创建跟踪的代码如下:

text = "[CLS] Who was Jim Henson ? [SEP] Jim Henson was a puppeteer [SEP]"
tokenized_text = tokenizer.tokenize(text)

# Masking one of the input tokens
masked_index = 8
tokenized_text[masked_index] = '[MASK]'
indexed_tokens = tokenizer.convert_tokens_to_ids(tokenized_text)
segments_ids = [0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1]

tokens_tensor = torch.tensor([indexed_tokens])
segments_tensors = torch.tensor([segments_ids])
dummy_input = [tokens_tensor, segments_tensors]

traced_model = torch.jit.trace(model, dummy_input)

dummy_input是张量列表,所以我不确定该Boolean类型在哪里发挥作用。有谁了解为什么会发生此错误以及是否发生布尔转换?

非常感谢

4

1 回答 1

10

这个错误意味着什么

当尝试使用具有数据相关控制流的模型时,会出现此警告torch.jit.trace

这个简单的例子应该更清楚:

import torch


class Foo(torch.nn.Module):
    def forward(self, tensor):
        # It is data dependent
        # Trace will only work with one path
        if tensor.max() > 0.5:
            return tensor ** 2
        return tensor


model = Foo()
traced = torch.jit.script(model) # No warnings
traced = torch.jit.trace(model, torch.randn(10)) # Warning

本质上,BERT 模型有一些依赖于数据的控制流(如循环),因此您会收到警告iffor

警告本身

您可以在此处查看 BERTforward代码。

如果:

  • 参数不会改变(比如None传递给 的值forward),之后它会保持这种状态script(例如在推理调用期间)
  • 如果有基于内部收集的数据__init__(如配置)的控制流,因为这不会改变

例如:

elif input_ids is not None:
    input_shape = input_ids.size()
    batch_size, seq_length = input_shape

只会作为一个分支运行torch.jit.trace,因为它只是跟踪张量上的操作并且不知道这样的控制流。

HuggingFace 团队可能已经意识到这一点,并且这个警告不是问题(尽管您可能会仔细检查您的用例或尝试使用torch.jit.script

一起去torch.jit.script

这将很难,因为整个模型必须torchscript兼容(torchscript有一个可用的 Python 子集,而且很可能无法使用 BERT 开箱即用)。

仅在必要时才这样做(可能不会)。

于 2021-03-22T15:26:44.557 回答