问题标签 [zend-lucene]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
310 浏览

symfony1 - Lucene 搜索有什么好的选择?

我有成千上万的简历,我想搜索以“计算机科学”为背景的简历。

所以,我用谷歌搜索并知道 Lucene 可以完成这项工作,我需要将数据提供给 Lucene 并索引所有文档。

在搜索特定文本(例如“计算机科学”)时,它会产生与结果匹配的 CV。

为此,我需要将 MSword-93/MSword-2007/PDF 转换为文本并提供 Lucene。

我可以从 MSword2007 文档中获取文本,但无法从 MSword 2003 获取文本。

有很多 pdf 作家,但我没有任何可以做到这一点的 PDF 阅读器库。

请稍微介绍一下 PDF 阅读器库并将 ms93 文档转换为文本,或者如果 Lucene 搜索有任何替代方案,请告诉我。

谢谢,非常感谢您的回答

0 投票
2 回答
2091 浏览

php - php foreach 重复两次

我一直在尝试不同的解决方案来解决这个问题,但没有成功。问题是这样的:

我有一些来自 Zend_Search_Lucene 的结果,它给出了 3 个结果,ID 为:2、3、4

然后我从一个用 Doctrine 制作的不相关查询中获得了一些记录,它给了我两条 ID 为 ID 的记录:2 和 3。

Search Lucene 的结果应该在页面上显示为总共 3 条记录。其中我需要检查一个ID是否等于Docrine查询的另一个ID,即是否存在匹配,即: 2=2 , 3=3 显示某些内容,如果不是,即: 2=3 显示其他内容。

尝试使用 FOREACH 两次和 IF ELSE 语句执行此操作,但我在页面上得到双重结果:

...ETC。

我理解为什么记录重复两次,但我不知道什么是获得正确结果的正确方法。有人可以帮忙吗?如果我在做一些愚蠢的事情,我很抱歉。:)

0 投票
3 回答
1048 浏览

zend-framework - Lucene Zend 对短语而不是单个单词进行模糊匹配

我正在尝试使用 Zend Lucene 来匹配查询短语,但我想要一个模糊匹配。

目前,如果我使用 PhraseQuery 并搜索“valentin rossi”,(在 DB 中有“valentino rossi”)我没有结果,因为 PhraseQuery 准确搜索字符串“valentin rossi”,没有模糊匹配或相似性字。

请给我一个提示,我必须在哪里寻找可行的解决方案。提前致谢!

0 投票
1 回答
119 浏览

php - 如何(或我可以)删除 Zend_Search_Lucene 创建的索引文件

有什么方法可以删除 Zend_Search_Lucene 创建的索引文件?如果不可能,请建议一种删除索引数据的方法。我已经从代码中尝试过了。但是失败了。当我试图从 Zend Studio 中删除索引文件时,它给了我一个错误,因为“资源与系统不同步”。我什至不能从应用程序文件夹中做到这一点。请问,有人可以帮帮我吗?

0 投票
2 回答
914 浏览

zend-lucene - Zend Lucene 删除文档问题

我正在尝试使用 zend lucene 删除文档。以下是我的代码

当我运行它并检查我的索引文件夹时,会创建一个像这样 _f4t5_1.del 的新文件

但是当我进行搜索时,已删除的文档在搜索中可用,并且还检查了

$index->​​numDocs();

此方法还在删除前后返回相同的计数。

任何帮助表示赞赏。

0 投票
2 回答
614 浏览

php - 原生 PHP 项目中的 Zend 搜索集成

我想将 zend 搜索集成到原生 PHP 项目中。我收到各种包含错误。

我做了一些研究,似乎在zf2之前写了很多关于它的旧文章。使用 zf1 它曾经是直截了当的。包括 lucene.php 就是这样。

然而,自从 zf2 发布以来,搜索组件不再是 zf2 框架的一部分,并且可以单独下载。当我包含 Lucene.php 时,脚本星星抱怨缺少类。(包括问题)

我应该包含所有文件还是应该使用某种自动加载器?

0 投票
0 回答
125 浏览

php - Zend lucene中的反向短语搜索

基本上我有两张表Locationcity, City 有 city_name 和 country_code。位置表中的 location_name 字段具有位置。我想找到位置国家。

我的表结构。

城市表

位置表

所以我使用 Zend Lucene 搜索在城市表中索引了两个字段(国家代码和城市名称)。我将从表位置获取位置名称,并使用关键字查询对 Lucene 索引进行搜索。

由于“城市”一词,我发现了很多匹配项。因此决定将其更改为词组搜索。像“Kansas city, mo”这样的短语搜索,但我没有找到结果。所以我意识到我想针对关键字“堪萨斯城,莫”搜索“堪萨斯城”。是否可以进行反向搜索或无论如何与位置表索引建立关系并找到国家代码

0 投票
1 回答
207 浏览

php - 教义 1 中的高级搜索

我在 DOCTRINE1 中使用 LIKE 查询来搜索数据库中的关键字。这是示例:我在 DB“Developer in the hell”中有一个可用的字符串

令人担忧的是,如果我搜索“开发者”,它会返回结果,但如果我搜索“开发者地狱”,则不会返回任何结果。因为字符串中的中间词被跳过了。

DOCTRINE 是否提供任何通配符/高级选项/条件来处理这种情况。

0 投票
1 回答
73 浏览

zend-framework - Encoding problems with Zend Lucene

I have some problems with Zend_Lucene, especially with characters encoding.

Because I'm french, I have to store a lot of specials characters...

So I set up a zend_lucene engine, and try to store my text.

Unfortunately, the text are stored with bad characters, as if Zend_Lucene could not read those characters (I've opened the cfs file to be sure about it).

But I set the default encoding as UTF-8, my input are in UTF-8...

The idea I got, was because I use windows and the file created by Zend_Lucene is not in UTF-8. But I have no idea how to create an UTF-8, or to make this up.

Do you have any idea ?

0 投票
1 回答
408 浏览

zend-framework - Zend Lucene 删除文档

我对删除索引文件中的文档有疑问。

我有这个:

我用卢克(它可以打开索引文件)

所以在删除之前我在我的索引条目中看到。删除此条目后,索引文件中仍然存在,但在文件夹中我看到了文件,例如 _c0_del。所以如果这是正常的,那么删除后我可以在索引文件中看到我的条目吗?还是我的代码中有一些错误?我试着做

ZendSearch/library/ZendSearch/Lucene/Index.php中删除方法。它给了我null。正常吗?如果删除方法从索引中物理删除文档或只是设置该文档已删除的标志?我可能在 2 年前使用 lucene,它从索引文件中物理删除了文档。因此,删除后,我无法通过 Luke 看到我在索引中的条目。