我目前正在做一个关于人名消歧的项目。该项目背后的想法是,当有多个同名的人时,它将能够识别正确的人。我为此使用了维基百科。我想根据一些标准数据评估我的项目。我正在寻找一些测试数据。我不熟悉维基百科中的流行名称。任何想法,我在哪里可以找到这些数据?我不是在寻找大量数据。我只是在寻找一些 100-500 个例子。
谢谢
为问题添加更多信息。
我正在寻找的是同名但实际上不同的人。例如,Michael Jordon 是一位著名的篮球运动员,并且还有一位统计学家同名。我正在寻找这样的例子。
http://en.wikipedia.org/wiki/Michael_Jordan http://en.wikipedia.org/wiki/Michael_I._Jordan
希望,你现在明白这个问题了。