问题标签 [clucene]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1032 浏览

iphone - 如何为 iOS 编译 CLucene?

我正在尝试为 iOS 编译 CLucene 并遇到一些问题。

这是我采取的步骤

  1. 修改 CLucene CMakeLists.txt 以禁用多线程
  2. 在 CLucene 源目录中创建“build-ios”目录
  3. 将 cmake 文件从此站点拖放到 cmake 目录http://code.google.com/p/ios-cmake/
  4. 运行以下命令“cmake -DCMAKE_TOOLCHAIN_FILE=./iOS.cmake -GXcode ../”

这是该命令的输出。有人可以帮我解决错误吗?

-- 使用默认 iOS SDK 的工具链:/Developer/Platforms/iPhoneOS.platform/Developer/SDKs/iPhoneOS5.0.sdk -- 寻找包含文件 CMAKE_HAVE_PTHREAD_H -- 寻找包含文件 CMAKE_HAVE_PTHREAD_H - 未找到。-- 找不到 Boost Boost,使用本地:/Users/aschuler/Desktop/clucene-core-2.3.3.4/src/ext CMake Error at /Applications/CMake 2.8-6.app/Contents/share/cmake- 2.8/Modules/FindPackageHandleStandardArgs.cmake:91(MESSAGE):找不到线程(缺少:Threads_FOUND)调用堆栈(最近调用优先):/Applications/CMake 2.8-6.app/Contents/share/cmake-2.8/Modules /FindPackageHandleStandardArgs.cmake:252 (_FPHSA_FAILURE_MESSAGE) /Applications/CMake 2.8-6.app/Contents/share/cmake-2.8/Modules/FindThreads.cmake:157 (FIND_PACKAGE_HANDLE_STANDARD_ARGS) src/shared/CMakeLists.txt:38 (find_package)

-- 配置不完整,出现错误!

谢谢你的帮助!

0 投票
3 回答
10335 浏览

lucene - 使用 CLucene 与 java lucene

我目前正在将 Java lucene 用于其中一个项目并获得不错的性能。我正在寻找 lucene 的 C/C++ 选项,并在 sourceforge 上遇到了 CLucene。

但是我想检查 CLucene 是否与 Java lucene 一样稳定可靠,并且具有 Java Lucene 支持的所有功能,它是否获得 apache 许可并得到积极支持?如果是,为什么我没有选择在 apache Lucene 站点上下载 CLucene(在 apache lucene 站点上我有 lucene.net 选项)。

想了解更多关于 CLucene 用于企业软件的信息。

0 投票
1 回答
1256 浏览

lucene - Search index replication

I am developing an application that requires a CLucene index to be created in a desktop application, but replicated for (read-only) searching on iOS devices and efficiently updated when the index is updated.

Aside from simply re-downloading the entire index whenever it changes, what are my options here? CLucene does not support replication on its own, but Solr (which is built on top of Lucene) does, so it's clearly possible. Does anybody know how Solr does this and how one would approach implementing similar functionality?

If this is not possible, are there any (non-Java-based) full-text search implementations that would meet my needs better than CLucene?

Querying the desktop application is not an option - the mobile applications must be able to search offline.

0 投票
0 回答
578 浏览

c++ - 如何在 Xcode 中构建 Clucene

我从这里下载了 Clucene ,我想在 Xcode 中构建它以便使用 Clucene。我已经使用 Cmake 构建了它并将其附加到我的项目中,但标题不存在,我无法导入标题。

有没有办法简单地将 Clucene 添加到 Xcode 并工作。我在 Visual Studio 中使用过 Lucene.net 甚至 Clucene,但在 Xcode 中使用 clucene 时遇到了一些麻烦。我搜索了很多,但仍然找不到答案,因为很少有人在 xcode 中使用 Clucene。如果您对如何做到这一点有任何想法,请告诉我。

谢谢你。

0 投票
1 回答
259 浏览

xhtml - 索引 XML 属性以及 CLucene 中的纯文本

我已经能够在 iOS 上编译 CLucene 项目,目前正尝试在我的 iOS 应用程序中使用它。我正在尝试索引 xhtml 文档,并且已经能够通过从这些文档中提取文本节点来做到这一点,然后通过将它们连接在一起来在 lucene 中进行索引,以便一个 xhtml 文档中的所有文本出现在一个单一的Lucene 文档。

但是,我的 xhtml 文档的每个文本节点都有自定义属性,因此当对索引文本进行搜索时,我也应该能够获得与该文本关联的属性。

我的 xml 数据如下所示:

因此,当我从 Lucene 索引中搜索单词样本时,我应该能够检索归因于单词 Sample 关联的数据值。在上述情况下,它将是 data-value="/1/2/3"。

我创建索引的方式是将数据值属性和文本节点字段连接在一起,然后由 Lucene 对其进行索引。这样,每当我的搜索结果返回时,它也会返回与之一起属性的数据值。我可以评估属性值,并且在搜索时会从显示结果中完全删除该属性。但是,对于包含在跨度文本中的大文本,情况并非如此,其中可能会返回搜索的单词,但数据值属性可能不是搜索结果的一部分,在显示时可以进一步剥离。

但是,我认为这不是索引 XML 属性及其文本数据的最佳方式。

如果有人可以帮助我使用该方法来索引文本与其属性之间的关系,我将不胜感激。

更新:我发现从文本生成的令牌可以有与之关联的有效负载,所以我在想,如果我们可以将 XML 属性内置为我的整个字符串的有效负载,可以将其视为单个令牌(如果我不分析文本),可能对我的目的有用。我想知道是否有人可以帮助我确定这是否适合我的情况。非常感谢您的帮助。

谢谢和问候, 阿希什

0 投票
1 回答
887 浏览

boost - qmake clucene-core-2.3.3.4 错误

好的,我真的需要更多关于如何通过 qt5 创建者在 cmake 向导中编译 clucene 的说明我设法通过 git 下载 clucene 源代码,然后我从 qt 运行 cmake 向导,它找到了两个编译器 gcc 和 g++,但仍然找不到boost 和 zlib 作为它,这是结果:

那么我应该在 cmake qt 向导中输入什么参数来让它了解 zlib 和 boost 文件夹的位置?

0 投票
0 回答
99 浏览

lucene - 使用 Lucene 2.9 索引格式读取目录时,代码块中的 CLucene 2.3.2 问题

(我的) CLucene 版本是 2.3.3

(客户端)Lucene 文件索引格式为 2.9.1

此时出现错误:

错误:截图

告诉我如何解决当前的错误,不兼容的 Lucene 版本?

卢克……?

0 投票
1 回答
474 浏览

ios - 是否建议只使用没有数据库的 Lucene 索引?

我正在开发一个 iOS 应用程序,它包含大约 600 本书,每本书大约 90 页(.pdf 文档)。我采用的方法是将所有文本放入数据库中,分成段落,然后调用并显示。为了提高搜索速度,我使用 CLucene 从数据库中索引了所有需要的数据并意识到,我现在有两个数据副本,并且我从索引而不是预期的数据库中获得了更好的访问时间。

我的问题是:是否建议或建议在没有数据库的情况下使用应用程序,并且只从索引中提取所有数据,即使在没有执行搜索的情况下也是如此。这将提高我的应用程序的速度和大小,因为不会包含数据库,但是否可取?

我将不胜感激任何帮助/建议,因为我在这方面缺乏经验,而且这是我第一次使用任何类型的搜索 API。

0 投票
1 回答
71 浏览

clucene - 防止某些文档在 clucene 中被索引

我正在使用 clucene 构建搜索索引,并且我想确保包含任何攻击性术语的文档永远不会被添加到索引中。使用带有停止列表的 StandardAnalyzer 还不够好,因为攻击性文档仍然会被添加,并且会被返回用于非攻击性搜索。

相反,我希望建立一个文档,然后检查它是否包含任何令人反感的词,然后仅在没有的情况下添加它。

干杯!

0 投票
1 回答
814 浏览

cmake - 制作 CLucene 时出错

我正在使用 MBP OSX(10.9) 并且是 CLucene 的新手,我在安装它时遇到问题。尽管严格遵循安装指南,但我在制作文件时仍然遇到这些错误

感谢是否有人可以帮助我解决这个问题?提前致谢