有人知道 Zend_Lucene 类是否支持 CJK(中文日文韩文)。
我想在我自己的网站上使用它,唯一的问题是它应该适用于英语和日语。
此外,如果有人有一些关于 Java 版本的 CJK 版本的资源,也将不胜感激。
谢谢
有人知道 Zend_Lucene 类是否支持 CJK(中文日文韩文)。
我想在我自己的网站上使用它,唯一的问题是它应该适用于英语和日语。
此外,如果有人有一些关于 Java 版本的 CJK 版本的资源,也将不胜感激。
谢谢
目前,这些是 Zend_Lucene 内置的唯一兼容 UTF-8 的分析器
您可以使用以下代码来使用它们:
Zend_Search_Lucene_Analysis_Analyzer::setDefault(
new Zend_Search_Lucene_Analysis_Analyzer_Common_Text());
如果需要,您还可以构建自己的分析器。
另一种解决方案是使用 Java Lucene 构建索引并在 PHP 中使用该索引,因为它们应该是兼容的。我还没有尝试过这个。
Zend_Search_Lucene 源自 Apache Lucene 项目。当前(从 ZF 1.6 开始)支持的 Lucene 索引格式版本为 1.4 - 2.3
您可以在 Zend Framework 手册中阅读更多相关信息。 链接文本