0

我需要对给定的单词实施关键短语的测量。这意味着该词的重要性,例如“example”一词不如“nuclear”一词重要。我试图实施的建议措施是一个简单的措施,它考虑了该词在 wiki 文章中出现的总数以及它在链接中出现的时间为

((link appearance)/(total appearances))

我可以检索“术语”的总出现次数

$url=http://en.wikipedia.org/w/api.php?&action=query&list=search&srlimit=50&srredirects&srprop=snippet&srnamespace=0&srsearch=term;
$page=unserialize(file_get_contents($url));
$totalhits=$page["query"]["searchinfo"]["totalhits"];

我现在需要的是一种方法来检索该单词出现在链接中的数字。提前谢谢。

4

1 回答 1

0

我认为您正在寻找的内容无法通过 API 合理访问。相反,您应该下载所有文章(特别是文件)的转储,pages-articles然后通过它来获取您需要的信息。

于 2013-04-23T15:05:28.497 回答