有人知道PHP中的词形还原器吗?或者,在最坏的情况下,以某种方式在 PHP webapp 中使用另一种语言(例如 python NLTK?)的词形还原器?
我正在构建一个宏观词源分析器,我遇到了这个词源数据库不包含共轭词的问题。我认为,词形分析器会纠正这个问题,当字典找不到“说”时给我“说”这个词,当字典找不到“更好”时返回“好”等。
注意:词干分析器不会做与词形还原器相同的事情。
与词干提取相比,词形还原相对更复杂,这就是为什么更难找到一些现成和免费的解决方案的原因。
我看到没有人回答子问题。
在 PHP webapp 中使用另一种语言(例如,python NLTK?)的词形还原器的某种方式
php 至少exec
和调用类似。可以简单地运行任何外部脚本或应用程序。
php 中有一些“lemmatizers”可以在互联网上找到,但快速检查一下,它们变成了“词干”。
确保,词干不会为你做。确保您已经想到的其他语言的解决方案是 Lemmatizer。
我怀疑所有接近此命名的解决方案都将使用类 C 语言。如果这些是开源的或作为库提供的,您可以将它们作为扩展构建到 PHP 中。