1

我目前正在做一个关于人名消歧的项目。该项目背后的想法是,当有多个同名的人时,它将能够识别正确的人。我为此使用了维基百科。我想根据一些标准数据评估我的项目。我正在寻找一些测试数据。我不熟悉维基百科中的流行名称。任何想法,我在哪里可以找到这些数据?我不是在寻找大量数据。我只是在寻找一些 100-500 个例子。

谢谢

为问题添加更多信息。

我正在寻找的是同名但实际上不同的人。例如,Michael Jordon 是一位著名的篮球运动员,并且还有一位统计学家同名。我正在寻找这样的例子。

http://en.wikipedia.org/wiki/Michael_Jordan http://en.wikipedia.org/wiki/Michael_I._Jordan

希望,你现在明白这个问题了。

4

3 回答 3

0

想知道为什么不能在 SO 用户上使用名称:https ://stackoverflow.com/users?tab=reputation

它已经按代表排名 - 所以你知道“流行的名字”。

于 2010-10-04T03:32:44.310 回答
0

http://en.wikipedia.org/wiki/Category:Redirects_to_disambiguation_pages是维基百科上的一个巨大的消歧页面列表。从中链接的每个页面都包含事物名称不明确的页面的链接。那是你要找的吗?

于 2010-10-04T03:54:48.787 回答