我刚刚开始使用 Tensorflow,使用 Caffe 以高效的方式读取数据非常实用,但是使用 Tensorflow 我发现我必须自己编写数据加载过程,创建 TFRecords,批处理,多重威胁,处理这些线程等等。所以我从一个示例开始,即 inception v3,因为它们处理要读取数据的部分。我是 Tensorflow 的新手,对 Python 也比较陌生,所以我觉得我不明白这部分到底发生了什么(我的意思是,它会将标签的大小扩展到 label_index * no of files - 但是 - 为什么?它是否为标签创建了一种热编码?我们必须这样做吗?为什么它不扩展长度或文件,因为每个文件都有一个标签?谢谢。
labels.extend([label_index] * len(filenames))
texts.extend([text] * len(filenames))
filenames.extend(filenames)
整个代码在这里:https ://github.com/tensorflow/models/tree/master/research/inception
提到的部分位于 data/build_image_data.py 下,并从现有数据集构建图像数据集作为存储在文件夹下的图像(其中文件夹名称是标签):https ://github.com/tensorflow/models/blob/master/research/inception /inception/data/build_image_data.py