我正在寻找一个与这个网页或多或少做同样事情的 PHP 库:http: //textalyser.net/
我知道python和java中有流行的库,但我正在寻找一个PHP版本。谢谢你的帮助!
我正在寻找一个与这个网页或多或少做同样事情的 PHP 库:http: //textalyser.net/
我知道python和java中有流行的库,但我正在寻找一个PHP版本。谢谢你的帮助!
据我所知,没有一个,或者至少没有一个知名/分布良好的。
我遇到的关闭事实上的代码是 Dave Child的php-text-statistics(因为PEAR 版本已经多年未维护),但它只关心可读性和句子、单词和音节的计数。您必须使用、
、等
获取的任何其他数据。当然还有一些数学技能来计算所有百分比。count_chars
str_word_count
substr_count
preg_match_all
也就是说,我不确定你希望图书馆做什么,或者http://textalyser.net/做什么......
(我的意思是什么是停止列表?或者一个详尽的多词短语,对于这个问题...?)
很老的问题......
无论如何,如果你想找到两个给定字符串之间的相似性,PHP 有一个内置函数similar_text
。
句法: similar_text ($first, $second, &$percent = null);
//*Find the similarity/difference between two strings in percentage
$pc = 0;
similar_text('You rock!', 'I Rock too!!',$pc);
print $pc;
输出: 57.142857142857
如上所述,此值是两个字符串相似的百分比。
注意:此函数区分大小写
$pc = 0;
similar_text('you', 'YOU',$pc);
print $pc;
会给0!
我遇到的另外两个这样的功能是:
Levenshtein Distance & Soundex
更多信息请查看官方文档
我目前正在寻找类似的东西,到目前为止我发现的选项是利用 Zend Lucene 搜索功能。
或者查看 Open Calais API。http://www.opencalais.com/(来自汤森路透)
我还没有深入探索任何一个选项,但我认为它们可能有一些里程用于构建动态链接或超(con)文本化网页。