2

我正在为 Tensorflow 2 中的数据集编写映射函数。数据集包含多个图像和相应的标签,更具体地说,标签只有三个可能的值,13、17 和 34。映射函数应该采用标签并将它们转换为分类标签。

可能有更好的方法来实现这个功能(请随时提出建议),但这是我的实现:

def map_labels(dataset):

    def convert_labels_to_categorical(image, labels):
        labels = [1.0, 0., 0.] if labels == 13 else [0., 1.0, 0.] if labels == 17 else [0., 0., 1.0]

        return image, labels

        categorical_dataset = dataset.map(convert_labels_to_categorical)

    return categorical_dataset

主要问题是我收到以下错误:

OperatorNotAllowedInGraphError: using a `tf.Tensor` as a Python `bool` is not allowed: AutoGraph is disabled in this function. Try decorating it directly with @tf.function.

我真的不知道这个错误意味着什么,并且互联网上没有太多其他来源记录相同的错误。任何想法?

编辑(新的非工作实现):

def map_labels(dataset):

    def convert_labels_to_categorical(image, labels):
        labels = tf.Variable([1.0, 0., 0.]) if tf.reduce_any(tf.math.equal(labels, tf.constant(0,dtype=tf.int64))) \
        else tf.Variable([0., 1.0, 0.]) if tf.reduce_any(tf.math.equal(labels, tf.constant(90,dtype=tf.int64))) \
        else tf.Variable([0., 0., 1.0])

        return image, labels

    categorical_dataset = dataset.map(convert_labels_to_categorical)

    return categorical_dataset
4

2 回答 2

1

我找到了一个可行的解决方案。首先,我创建了一个字典,然后是数据集:

dictionary = {"data":data, "labels":labels.astype('int32')}
dataset = tf.data.Dataset.from_tensor_slices(dict(dictionary))

这使我可以轻松访问数据集中的数据和标签。可能还有其他不需要使用字典的方法,但这一种对我有用。对于我使用的映射:

def map_labels(dataset):

    def convert_labels_to_categorical(dataset):
        if dataset['labels'] ==  tf.constant(13):
            dataset['labels'] = tf.constant([1, 0, 0]) 

        elif dataset['labels'] == tf.constant(17):
            dataset['labels'] =  tf.constant([0, 1, 0])

        elif dataset['labels'] == tf.constant(34):
            dataset['labels'] = tf.constant([0, 0, 1])

        return dataset

    categorical_dataset = dataset.map(convert_labels_to_categorical)

    return categorical_dataset

映射数据集后,如果我用 进行检查categorical_dataset.element_spec,我会得到:

{'data': TensorSpec(shape=(32, 32, 3), dtype=tf.uint8, name=None), 'labels': TensorSpec(shape=(None,), dtype=tf.int32, name=None)}

如果我打印元素,新的分类标签会正确分配给相应的图像。总之,==仍在=为 tf 变量工作。

于 2020-04-19T13:36:05.767 回答
0

您的问题来自您将 Python 代码与 TensorFlow 代码混合在一起的事实。

实际上,在您的map函数中,您使用任意 Python 代码,而不是专门优化的 TensorFlow 代码

map函数中,您只能使用属于tf*类别的函数。如果您仍想使用任意 Python 代码,则需要使用该tf.py_function()库。

您可能需要查阅此线程以获得更好的概述:

对于自定义 Python 代码,是否有替代 tf.py_function() 的方法?

要解决您的问题,您需要专门使用tf模块中的函数,例如tf.stringstf.bool

于 2020-04-17T15:40:42.130 回答