-1

根据该网站: http: //ir.dcs.gla.ac.uk/test_collections/access_to_data.html,格拉斯哥大学有偿分发 wt2g 收藏。这个集合基本上是由几个解析的网页组成的。我很好奇 wt2g 集合有多少标签。这将帮助我估计收藏中的文件数量,这将进一步确定我是否应该购买该收藏。谢谢

4

2 回答 2

0

根据这篇文章,WT2g 集合中有 25 万页。但是这个页面的信息,意味着该集合中有18万页。

于 2012-08-28T11:25:41.200 回答
0

WT2G 语料库中的文档数为 247491。

于 2012-08-30T14:47:09.967 回答