2

有谁知道一个可用的 PHP 函数,它需要一段文本,比如几百个单词,并产生一个关键字数组?IE。最重要、经常出现的独特术语?

谢谢菲利普

4

2 回答 2

7

不存在这样的功能(如果有的话会很神奇)但是要开始一些事情,您可以执行以下操作:

  1. 在空格处拆分文本,生成单词数组。
  2. 删除停用词和不必要的标点和符号(可能使用正则表达式- 请参阅preg_replace)。
  3. 统计剩余数组中每个单词出现的次数,并按照出现频率排序(所以出现频率最高的单词在第一个偏移量,即$words[0])。
  4. 使用array_unique删除重复项,从而生成按出现频率排序的唯一关键字数组。
于 2009-08-27T01:32:39.213 回答
0

这样的事情可能会奏效:

$thestring = 'the most important, frequently occuring unique terms?';
$arrayofwords = explode(" ", $thestring);
echo print_r($arrayofwords);

您也可以将逗号“,”替换为空白,这样您就可以获得干净的关键字。

$thestring = 'the most important, frequently occuring unique terms?';
$cleaned_string = str_replace(",", "", "$thestring");
$arrayofwords = explode(" ", $cleaned_string);
echo print_r($arrayofwords);
于 2009-08-27T01:38:44.730 回答