2

有人知道 Zend_Lucene 类是否支持 CJK(中文日文韩文)。

我想在我自己的网站上使用它,唯一的问题是它应该适用于英语和日语。

此外,如果有人有一些关于 Java 版本的 CJK 版本的资源,也将不胜感激。

谢谢

4

1 回答 1

2

目前,这些是 Zend_Lucene 内置的唯一兼容 UTF-8 的分析器

  • Zend_Search_Lucene_Analysis_Analyzer_Common_Utf8
  • Zend_Search_Lucene_Analysis_Analyzer_Common_Utf8Num
  • Zend_Search_Lucene_Analysis_Analyzer_Common_Utf8_CaseInsensitive
  • Zend_Search_Lucene_Analysis_Analyzer_Common_Utf8Num_CaseInsensitive

您可以使用以下代码来使用它们:

Zend_Search_Lucene_Analysis_Analyzer::setDefault(
new Zend_Search_Lucene_Analysis_Analyzer_Common_Text());

如果需要,您还可以构建自己的分析器。

另一种解决方案是使用 Java Lucene 构建索引并在 PHP 中使用该索引,因为它们应该是兼容的。我还没有尝试过这个。

Zend_Search_Lucene 源自 Apache Lucene 项目。当前(从 ZF 1.6 开始)支持的 Lucene 索引格式版本为 1.4 - 2.3

您可以在 Zend Framework 手册中阅读更多相关信息。 链接文本

于 2009-10-06T15:24:59.987 回答