3

我正在尝试使用 GATE 众包插件在 CrowdFlower 上创建工作。我的问题是我根本无法将数据加载到作业中。到目前为止,我在创建工作方面所做的是:

  1. 在 PR 中创建工作生成器。

  2. 右键单击作业生成器并选择创建一个新的 CrowdFlower 作业。该工作出现在我在 CrowdFlower 中的工作列表中。

  3. 用一些文档填充语料库,用一些 ANNIE 的应用程序对它们进行预处理,例如分词器和句子拆分器

  4. 将作业生成器添加到语料库管道,编辑一些参数,使其与初始注释(标记和句子)匹配

  5. 运行管道。(当然我要确保 Job ID 匹配)

在我做完所有这些之后,这项工作仍然有 0 行数据。我想知道我是否做错了什么,因为我确信我遵循了本教程的所有说明,特别是从第 28 页到第 35 页。对此有什么建议吗?

4

1 回答 1

1

我敢打赌,您在作业生成器运行时参数之一中有错字:)

仔细检查注释和注释集的名称,确保它们都存在于您的文档中。如果它们存在并且构建器找到它们,则 cf_..._id 特征应出现在每个实体注释上。

如果作业构建器发现任何注释,它将调用众包 API,如果上传数据失败,则会引发异常。听起来它确实没有发送任何请求,我看到的唯一原因是它找不到注释。

于 2015-10-25T15:34:02.730 回答