6

有人知道PHP中的词形还原器吗?或者,在最坏的情况下,以某种方式在 PHP webapp 中使用另一种语言(例如 python NLTK?)的词形还原器?

我正在构建一个宏观词源分析器,我遇到了这个词源数据库不包含共轭词的问题。我认为,词形分析器会纠正这个问题,当字典找不到“说”时给我“说”这个词,当字典找不到“更好”时返回“好”等。

注意:词干分析器不会做与词形还原器相同的事情。

4

4 回答 4

0

这有帮助吗?

http://tartarus.org/~martin/PorterStemmer/php.txt

这是 Porter Stemmer 算法的 PHP5 实现。

于 2013-09-18T19:33:30.217 回答
0

https://github.com/heromantor/phpmorphy不是您要找的吗?

于 2013-09-18T21:24:58.123 回答
0

与词干提取相比,词形还原相对更复杂,这就是为什么更难找到一些现成和免费的解决方案的原因。

我看到没有人回答子问题。

在 PHP webapp 中使用另一种语言(例如,python NLTK?)的词形还原器的某种方式

php 至少exec和调用类似。可以简单地运行任何外部脚本或应用程序。

php 中有一些“lemmatizers”可以在互联网上找到,但快速检查一下,它们变成了“词干”。

确保,词干不会为你做。确保您已经想到的其他语言的解决方案是 Lemmatizer。

我怀疑所有接近此命名的解决方案都将使用类 C 语言。如果这些是开源的或作为库提供的,您可以将它们作为扩展构建到 PHP 中。

于 2014-03-17T12:46:46.253 回答
0

我用谷歌搜索了这个:

http://pastebin.com/WNvb2zB4

和这个。

http://tartarus.org/~martin/PorterStemmer/php.txt

不知道它们中的任何一个是否有效。

于 2013-09-18T19:35:30.530 回答