0

现在我有一个看似简单但具有挑战性的任务。我需要开发一个问题数据集,并将问题分为两类:

  1. 事实问题:“谁是法国现任总统。”
  2. 自由提问:“请您帮我评价一下下面的相机吗?”

现在我需要知道 Yahoo! 上这两个类别的百分比!回答,以便我可以相应地维护我的数据集,但我不知道进行此统计的好方法。手动执行似乎真的不可能,有人有想法吗?我将非常感激,谢谢。

4

1 回答 1

1

你的意思是,从另一个中认出一个?自动,没有从站点的末端进行任何分类?这恐怕是不可能的。

我认为你能做的最好的就是比较一些指标。“免费”问题可能会倾向于有更多的贡献和更多的文本;如果 Y!Answers 有一个讨论系统,他们会被更多地讨论......“Factoid”问题可能更频繁地以“什么是......”开头......等等。

也许随机抽取 100 个问题,手动检查并写下百分比。

于 2010-09-20T09:33:38.303 回答