问题标签 [indri]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
96 浏览

search - 狐猴 CGI 的配置问题

我正在尝试启动并运行一个简单的狐猴 CGI,但是当我在浏览器中导航到 lemur.cgi 时,我收到 500 服务器配置错误。

内部服务器错误

服务器遇到内部错误或配置错误,无法完成您的请求。

请联系服务器管理员 root@localhost 并告知他们错误发生的时间,以及您所做的任何可能导致错误的事情。

服务器错误日志中可能提供有关此错误的更多信息。

我通过在~/indri_test/param_files/. 这创建了一个与索引同名的子目录,./krovetz_stop.

我可以毫无问题地使用 IndriRunQuery 手动查询索引。

我按照教程设置了 CGI,我执行了以下步骤:

然后我更新了lemur.config文件~/public_html以指向我的索引(更正式地说,我将它指向在我构建索引时创建的子目录,因为否则我不确定“索引路径”是什么)。这是我的 lemur.config 文件:

据我所知,一切都应该有效,但事实并非如此。也许我需要用自动工具重建 CGI?任何想法我可以采取哪些步骤来调试问题?也许我没有使用正确的索引路径?我需要修改索引目录的权限吗?

谢谢

0 投票
1 回答
209 浏览

information-retrieval - IndriUI 索引未建立

我正在尝试使用 Indri UI 构建索引。我创建了用于构建索引的参数文件和停用词列表。当我单击构建索引时,UI 会持续构建很长时间,并且永远不会构建索引。

在此处输入图像描述

UI挂在这里,

在此处输入图像描述

这是我的 input.txt 文件,

这是我的 stopwords.txt,

我错过了什么吗?请帮助我,我是 IR 的新手。我不知道参数文件。我创建了一个,但我不确定它在哪里使用。

0 投票
1 回答
129 浏览

java - Indri 搜索引擎 - 未创建 libindri_jni

我正在按照此处的说明 ( http://lemur.sourceforge.net/indri/index.html ) 在我的 Mac 上安装 Indri 5.7 版。它说明了使用 --enable-java 的选项,它将在安装目录中生成一个名为 /lib/libindri_jni.so 的 lib 文件。但是,经过多次尝试,即使安装成功,也永远不会创建 libindri_jni.so。

有没有人遇到过同样的问题并且知道解决方案。

在此先感谢,阿米特

0 投票
0 回答
157 浏览

c++ - Makefile:在 -o 之后添加标志

我正在尝试使用 VirtualBox 在 Ubuntu 14.04 LTS 上编译 Indri 5.9(从http://sourceforge.net/projects/lemur/下载),但是在“env CPP=/usr/bin/cpp CXX=/usr/bin/g++”之后./configure”,当我“make”时,我遇到了一个问题:ator.cpp:216:undefined reference to 'gzopen'。我已经通过“sudo apt-get install zlib1g-dev”安装了 zlib1g0dev,根据ZLIB 的编译问题,似乎我必须在“-o”的末尾添加“-lz”。但是,这是我的 Makefile:

这是 MakeDefns:

我是 Makefile 的新手,所以有人可以帮我添加“-lz”吗?或编译 Indri 5.9 的任何其他建议。非常感谢!

0 投票
1 回答
585 浏览

java - 如何在java中使用indri进行索引?

我从教程中找到了这段代码,但它不起作用。它给了我一个例外。

myindex变量中,我提供了IndexUI.jar文件的路径。我是新来的。我不太了解它的用法。我已经下载了 indri 5.9

0 投票
1 回答
101 浏览

java - 狐猴项目中 IndriRunQuery 的空白输出

我正在将 lemur 用于 nlp 项目,并且我成功地索引了一些数据我想通过 IndriRunQuery 命令参数文件对索引文件运行查询:

没有错误,没有答案。输出中只有一个空行

0 投票
0 回答
190 浏览

java - Lucene中的多值字段相似度评分,字段间取AVG分数或MAX分数

有没有什么办法可以修改Lucene默认的相似度评分功能以支持多值字段搜索,即对于具有三个“persons”字段的文档,每个名称会有三个不同的相似度评分。

例如,将一篇论文作为一个文档进行索引,其作者有多个别名,

第一人:大卫·鲍伊、大卫·罗伯特·琼斯、Ziggy Stardust、瘦白公爵

第二人:大卫莱特曼

第三人:大卫·哈塞尔霍夫、大卫·迈克尔·哈塞尔霍夫

当我们搜索“David”时,是否可以返回 3 个不同的相似度得分,其中 Score(Person 2) > Score(Person 3) > Score(Person 1)。

此外,我们能否实现 Indri 风格的 MAX 或 AVG 运算符,其中 MAX(document)=Score(Person 2) 和 AVG(document)=AVG{Score(Person 2), Score(Person 3), Score(Person 1)}

任何指向可以修改 Lucene 实现部分的指针都将受到赞赏。谢谢。

0 投票
1 回答
63 浏览

information-retrieval - 在 Lemur Indri 上制定布尔查询

我无法使用 Indri 查询语言编写以下布尔查询。我需要编写的查询如下:

我需要包含上述内容的所有文件的列表。我该怎么做呢?

0 投票
1 回答
410 浏览

information-retrieval - 我们可以使用 F-measure、precision、recall 和排序的检索结果吗?

我正在使用 Indri 和 TrecEval,我想知道我们是否可以使用 F-measure、precision、recall 和排名检索结果。

如果是,那么 F-measure... 将意味着什么?这些值是否相关,例如评估查询是否接近语料库?

我知道 MAP 值用于评估排名结果。但我想知道 F-measure... 是否对其他东西有用。我在这里很困惑,我进行了研究,但有些东西我没有得到。

谢谢你的帮助。

0 投票
0 回答
23 浏览

information-retrieval - IR with indri - 如何通过索引获取平滑值和文档数据

我有一个索引(我没有建立它,所以我没有文档),我想从索引中获取这些值:
1. 索引基于哪些文档?它们的长度是多少?
2. 我可以得到每个文档的词袋值吗?我知道我可以使用 RunQuery_tfidf.xml 获取所有语料库的值,但我想要每个文档的值。
3.有没有办法获得平滑