我想构建一个应用程序来识别壁纸上使用了哪些表情符号。
因此,例如这个应用程序将接收输入:
在输出中,识别表情符号的名称数组应返回:
[
"Smiling Face with Sunglasses",
"Grinning Face with Smiling Eyes",
"Kissing Face with Closed Eyes"
]
当然,这些表情符号的名称将来自训练图像的文件名称。例如这个文件:
它将被称为Grinning_Face_with_Smiling_Eyes.jpg
我想使用 AWS Rekognition Label 或 Google AutoML Vision,但它们需要每个表情符号至少 10 张图像进行训练。如您所知,我只能提供每个表情符号的一张图像,因为没有更多选择,它们是 2D 的;)
现在我的问题是:我该怎么办?我怎样才能跳过这些要求?我应该选择哪种服务?
PS。在实际业务中,不是表情符号,而是人工智能必须识别的书籍封面。每张 2D 书籍封面照片也有一张图像。