2

我正在研究机器学习,我想使用 Google Cloud ml 服务。

此时,我已经使用 Tensorflow 的 retrain.py 代码(https://github.com/tensorflow/tensorflow/blob/master/tensorflow/examples/image_retraining/retrain.py#L103)训练了我的模型,并且我已经导出了结果到 cloudml(export 和 export.meta 文件)。但是,当我尝试使用命令(https://cloud.google.com/ml/reference/commandline/predict)预测新数据时:

gcloud beta ml predict

它总是返回相同的结果(我想预测不同的数据)。这怎么可能?

我的数据是从 jpeg 以文本格式解码的图像:

echo "{\"image_bytes\": {\"b64\": \"`base64 image.jpg`\"}}" > instances

你有什么建议吗?

4

3 回答 3

2

此问题有多种可能的原因。首先想到的是模型中的权重在导入时可能会被初始化为零。如果图中定义了初始化(参见loader),则可能会发生这种情况。要检查这一点,请使用以下命令:

from tensorflow.contrib.session_bundle import session_bundle

session, _ = session_bundle.load_session_bundle_from_path("/path/to/model")
print(s.graph.get_collection("serving_init_op"))

如果该集合中有东西,请确保它没有初始化变量。

如果没有初始化器,请确保权重本身看起来合理,例如,

session, _ = session_bundle.load_session_bundle_from_path("/path/to/model")
print(session.run("name_of_var:0"))

如果所有这些都得到验证,那么您可能需要注意图表的输入以及转换这些输入后的输出。为此,您可以使用session.run运行图的部分。例如,您可以提供一个 jpeg 字符串,并通过在调用session.run.

例如,使用这篇文章中的示例,我们可以从磁盘加载 JPEG,将其输入到图形中,然后查看调整大小和缩放后的数据是什么样子:

INPUT_PLACEHOLDER = 'Placeholder:0'
DECODE_AND_RESIZE = 'map/TensorArrayPack_1/TensorArrayGather:0'
SCALED = 'Mul:0'

# Read in a sample image, preferably with small dimensions.
jpg = open("/tmp/testing22222.jpg", "rb").read()

session, _ = session_bundle.load_session_bundle_from_path("/path/to/model")
resized, scaled = session.run([DECODE_AND_RESIZE, SCALED], feed_dict={INPUT_PLACEHOLDER: [jpg]})

通过战略性地将张量的名称放置在列表中的图表中fetch,您可以检查神经网络的任何给定层中正在发生的事情,尽管最可能的问题在于输入和/或变量。

棘手的部分是找出张量的名称。您可以name在定义大多数操作时使用该属性,这可能会有所帮助。你也可以使用类似的东西:

 print([o.name for o in session.graph.get_operations()])

帮助检查图中的操作。

最后,您可能还想尝试在本地运行图表,以便在调试时最小化反馈周期。查看示例中的local_predict.py以获取有关如何执行此操作的示例。这将帮助您快速迭代以识别模型本身的问题。

于 2016-12-02T17:06:04.620 回答
1

谷歌发表了一篇关于图像识别任务和一些相关代码的博文。它从您提到的 retrain.py 示例开始,但对其进行了所有修改以使其在 Cloud ML 上运行。

于 2016-12-16T21:44:47.560 回答
1

也可能是您的输入需要缩放。如果您有一个输入的大小压倒其他所有输入,则优化可能很差。如果您得到的结果接近目标变量的平均值,就会发生这种情况。

这在您的特定情况下不太可能,因为您的输入是图像,您的输入值是否可能类似地缩放,但如果您从 csv 文件进行训练,则更常见。

于 2016-12-03T02:13:12.187 回答