0

我想构建一个应用程序来识别壁纸上使用了哪些表情符号。

因此,例如这个应用程序将接收输入:

在此处输入图像描述

在输出中,识别表情符号的名称数组应返回:

[
  "Smiling Face with Sunglasses", 
  "Grinning Face with Smiling Eyes", 
  "Kissing Face with Closed Eyes"
]

当然,这些表情符号的名称将来自训练图像的文件名称。例如这个文件:

在此处输入图像描述

它将被称为Grinning_Face_with_Smiling_Eyes.jpg

我想使用 AWS Rekognition Label 或 Google AutoML Vision,但它们需要每个表情符号至少 10 张图像进行训练。如您所知,我只能提供每个表情符号的一张图像,因为没有更多选择,它们是 2D 的;)

现在我的问题是:我该怎么办?我怎样才能跳过这些要求?我应该选择哪种服务?

PS。在实际业务中,不是表情符号,而是人工智能必须识别的书籍封面。每张 2D 书籍封面照片也有一张图像。

4

0 回答 0