0

我们有客户要求使用 Watson Visual Recognition 搜索集合中的相似图像。文档提到每个集合可以包含 100 万张图像。因此,我有以下问题:

a) 图像的最大尺寸是多少?

b) 每张图片上传最多需要 1 秒,标准计划每天限制为 25000 张图片。那么,每天只能将 25k 图像添加到集合中吗?

c) 客户有大约 200 万张图像。我们怎样才能更快地上传图像?

d) 是否有单独的批量处理计划?

4

2 回答 2

3

此信息来自以下 url 的 Visual Recognition 文档: https ://www.ibm.com/watson/developercloud/doc/visual-recognition/customizing.html

大小限制
训练调用和数据有大小限制:

  • 该服务最多接受 10,000 张图像或每个 .zip 文件 100 MB。
  • 该服务要求每个 .zip 文件至少包含 10 个图像。
  • 该服务每次培训调用最多接受 256 MB。
  • 图片的最小推荐尺寸为 32X32 像素。

良好培训指南 锚链接
API 不强制执行以下指南。但是,当训练数据符合它们时,服务往往会表现得更好:

  • 建议在每个 .zip 文件中至少包含 50 张图像,因为少于 50 张图像会降低经过训练的分类器的质量。
  • 如果训练数据的质量和内容相同,那么在更多图像上训练的分类器通常会比在更少图像上训练的分类器更准确。在更多图像上训练分类器的好处在大约 5000 张图像上达到稳定水平,这可能需要一段时间来处理。您可以在超过 5000 张图像上训练分类器,但可能不会显着提高分类器的准确性。
  • 每个 .zip 文件总共上传 150-200 张图像可以让您在训练时间和提高分类器准确性之间取得最佳平衡。超过 200 张图像会增加时间,并且确实会提高准确性,但所花费的时间会减少回报。
  • 在每个示例文件中包含大致相同数量的图像。包含不相等数量的图像会导致训练分类器的质量下降。
  • 自定义分类器的准确性可能会受到您为训练它而提供的图像种类的影响。提供与您计划分析的图像相似的示例图像。例如,如果您正在训练分类器“老虎”,如果您只提供手机拍摄的动物园中老虎的图像来训练分类器,那么您的分类器可能会不太准确,但您想在老虎的图像上测试分类器由专业摄影师拍摄的野外。

大容量分类锚链接指南

如果要对多张图片进行分类,一次提交一张图片可能需要很长时间。您可以通过以下方式最大限度地提高服务的效率和性能:

  • 将图像大小调整为宽度或高度不超过 320 像素。图像不需要是高分辨率的。
  • 以压缩 (.zip) 文件的形式批量提交图像。
  • 在 classifier_ids 参数中仅指定您想要结果的分类器。如果您不为此参数指定值,则服务会根据默认分类器对图像进行分类,并需要更长的时间才能返回响应。
于 2017-06-05T16:42:21.630 回答
0

Ravi,我看到您也在 developerWorks 上发布了您的问题 - 请在此处查看我的答案:https ://developer.ibm.com/answers/questions/379227/similarity-search-api-of-watson-visual-recognition/

于 2017-06-06T17:38:44.597 回答