amazon-web-services - 用于流式传输无尽的任务列表的机械土耳其人架构

Question

我们应该如何构建一个使用 Amazon Mechanical Turk API 来处理任务流而不是单批批量任务的解决方案？

这里有更多信息：

我们的应用程序每天接收大约 1,000 张照片和视频流。每个图片或视频包含需要转录的 6-8 个数字（它是电子设备的序列号），以及转录的“确定性级别”（例如“Certain”、“Uncertain”、“Can't Read ”）。每个图像的转录时间不到 10 秒，每个视频的转录时间不到 20 秒，并且需要最少的技能或培训。

我们的应用程序将全天不断上传这些图像，我们希望在几分钟内将它们变成数字。理想的解决方案是我们每分钟上传一次新任务（高峰期每分钟不到 20 个）并每分钟下载一次结果。

两个问题：

为确保快速周转时间、准确性和成本效益之间的良好平衡，我们应该一次提交一项任务，还是最好批处理任务？如果是这样，在设置批量大小时我们应该考虑哪些变量？
是否存在包装 MTurk API 的库或托管服务，以便更轻松地处理像我们这样的 HIT 生成是流式和持续而不是一次性的用例？

为新手问题道歉，我们是 Mechanical Turk 的新手。

score 1 · Accepted Answer

一次将任务流式传输到土耳其人

您可以使用CreateHIT操作通过 Mechanical turk 的 api 单独流式传输任务。每次在应用程序中收到图像时，都可以调用 CreateHIT 操作立即将任务发送给 Turk。

您还可以通过 api 设置通知，以便在任务完成后立即收到警报。Turk 通知 API 文档

批处理与流式处理

至于批处理与流式传输，您最好使用流式传输以实现周转时间和成本的良好平衡。批处理不会过多地降低成本，提高准确性在很大程度上取决于手动或实施自动化流程来审查、审查和跟踪工人的表现。

图书馆和服务

大多数库都提供 api 中可用的所有操作，因此您只需 google 或在 Github 上搜索您的编程语言的库。（我们使用 Ruby 库rturk）

可以在 Quora 上对以下问题的回答的Metaplatforms部分找到提供托管解决方案的公司列表：有哪些类似于 Amazon Mechanical Turk 的众包服务？（免责声明：我的公司Houdini是其中列出的解决方案之一。）

amazon-web-services - 用于流式传输无尽的任务列表的机械土耳其人架构

1 回答 1

一次将任务流式传输到土耳其人

批处理与流式处理

图书馆和服务

Related

Reference