我需要对给定的单词实施关键短语的测量。这意味着该词的重要性,例如“example”一词不如“nuclear”一词重要。我试图实施的建议措施是一个简单的措施,它考虑了该词在 wiki 文章中出现的总数以及它在链接中出现的时间为
((link appearance)/(total appearances))
我可以检索“术语”的总出现次数
$url=http://en.wikipedia.org/w/api.php?&action=query&list=search&srlimit=50&srredirects&srprop=snippet&srnamespace=0&srsearch=term;
$page=unserialize(file_get_contents($url));
$totalhits=$page["query"]["searchinfo"]["totalhits"];
我现在需要的是一种方法来检索该单词出现在链接中的数字。提前谢谢。