1

我知道数据越多越好,但是训练 SyntaxNet 所需的合理数据量是多少?

4

1 回答 1

3

基于一些试验和错误,我达到了以下最低要求:

  • 训练语料库 - 18,000 个标记(任何少于该标记和第 2 步 - 使用标记器进行预处理 - 失败)
  • 测试语料库 - 2,000 个标记(任何少于此的标记和第 2 步 - 使用标记器进行预处理 - 失败)
  • 开发语料库 - 2,000 个代币

    但请注意,有了这个,我只设法让 NLP 管道中的步骤运行,实际上我还没有设法从中得到任何可用的东西。

  • 于 2017-01-29T11:39:45.880 回答