7

我正在寻找一个与这个网页或多或少做同样事情的 PHP 库:http: //textalyser.net/

我知道python和java中有流行的库,但我正在寻找一个PHP版本。谢谢你的帮助!

4

3 回答 3

3

简答

据我所知,没有一个,或者至少没有一个知名/分布良好的。

长答案

我遇到的关闭事实上的代码是 Dave Child的php-text-statistics(因为PEAR 版本已经多年未维护,但它只关心可读性和句子、单词和音节的计数。您必须使用、 、等 获取的任何其他数据。当然还有一些数学技能来计算所有百分比。count_charsstr_word_countsubstr_countpreg_match_all

也就是说,我不确定你希望图书馆做什么,或者http://textalyser.net/什么......
(我的意思是什么停止列表?或者一个详尽的多词短语,对于这个问题...?)

于 2009-12-13T20:15:13.450 回答
3

很老的问题......
无论如何,如果你想找到两个给定字符串之间的相似性,PHP 有一个内置函数similar_text

句法: similar_text ($first, $second, &$percent = null);

//*Find the similarity/difference between two strings in percentage
$pc = 0;
similar_text('You rock!', 'I Rock too!!',$pc);
print $pc;

输出: 57.142857142857

如上所述,此值是两个字符串相似的百分比。

注意:此函数区分大小写

$pc = 0;
similar_text('you', 'YOU',$pc);
print $pc;  

会给0!

我遇到的另外两个这样的功能是:
Levenshtein Distance & Soundex

更多信息请查看官方文档

于 2011-07-26T17:48:35.447 回答
2

我目前正在寻找类似的东西,到目前为止我发现的选项是利用 Zend Lucene 搜索功能。

http://www.opendocs.net/php/zend/ZendFramework-0.1.5/documentation/end-user/pl/zend.search.extending.html

或者查看 Open Calais API。http://www.opencalais.com/(来自汤森路透)

我还没有深入探索任何一个选项,但我认为它们可能有一些里程用于构建动态链接或超(con)文本化网页。

于 2010-05-04T16:24:08.747 回答