问题标签 [lemur]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
101 浏览

java - 狐猴项目中 IndriRunQuery 的空白输出

我正在将 lemur 用于 nlp 项目,并且我成功地索引了一些数据我想通过 IndriRunQuery 命令参数文件对索引文件运行查询:

没有错误,没有答案。输出中只有一个空行

0 投票
1 回答
74 浏览

javascript - JS:在搜索引擎界面拖放图片

我正在构建一个搜索引擎界面。我在狐猴索引中有一些网页原始内容(包括图像)。我想拖放图像并稍后实现图像搜索。我知道如何通过设置 draggable="True" 使图像在 HTML 中可拖动。但更改 Lemur 索引中的原始内容对我来说不是一个好选择。有什么方法可以在我的 main.js 中实现图像拖放?

顺便说一句,我目前通过以下方式实现文本拖放: var selection=document.getElementById('lemurbox').contentWindow.getSelection();

但这似乎只能获取文本,因为拖动图像后选择将为 NULL。

0 投票
1 回答
559 浏览

java - What metrics can I use to validate and test RankNet in the RankLib library in the Lemur Project?

I am currently using the RankLib implementation of the RankNet algorithm (-ranker 4) with a held-out set. I am using the jar file in terminal to run this.

The documentation stipulates:

metric2t (e.g. NDCG, ERR, etc) only applies to list-wise algorithms (AdaRank, Coordinate Ascent and LambdaMART). Point-wise and pair-wise techniques (MART, RankNet, RankBoost), due to their nature, always use their internal RMSE / pair-wise loss as the optimisation criteria.

However, when I set the 'metrics2t' to ERR@10 or NDCG@10, it starts to train and validate on my chosen metric rather that 'RMSE'.

This is part of the table outputted when I run RankNet with ERR@10.

Is there something that I am missing as this seems to be a contradiction to me.

Thanks.

0 投票
1 回答
63 浏览

information-retrieval - 在 Lemur Indri 上制定布尔查询

我无法使用 Indri 查询语言编写以下布尔查询。我需要编写的查询如下:

我需要包含上述内容的所有文件的列表。我该怎么做呢?

0 投票
1 回答
68 浏览

java - Galago 安装失败:JAVA_HOME 未正确定义

我正在尝试通过 unix 上的二进制文件(galago-3.12-bin)安装 Galago。当我运行该文件时,我收到以下错误:

SEF-IS-017660:galago-3.12-bin anton$ bin/galago 错误:未正确定义 JAVA_HOME。我们无法执行 /System/Library/Frameworks/JavaVM.framework/Versions/CurrentJDK/Home/bin/java

当我检查我的 java 主目录时,我得到:

SEF-IS-017660:galago-3.12-bin anton$ echo $(/usr/libexec/java_home) /Library/Java/JavaVirtualMachines/jdk1.8.0_131.jdk/Contents/Home

我该如何纠正这个问题?安装需要某个主目录,但我的不同?

0 投票
1 回答
115 浏览

java - 安装 Galago 时出错

嗨,我想从 netbeans IDE 或 Promt 命令行使用 mvn 包安装 Galago 我安装了 maven

但是,当我使用依赖项运行构建时,我收到以下错误消息:

你能帮助我吗?

0 投票
1 回答
426 浏览

python - Lemur Ra​​nkLib 在训练时返回代码 1

我正在使用 RankLib 为我的数据(形状:218279 行 × 1504 列)使用 python 并得到错误代码 1,没有输出。我只是想知道关于 RankLib 上的错误代码是否有任何文档?

我正在为我的项目使用 Jupyter iPython,并使用 subprocess.run 运行该过程。如果您想知道,下面是我的训练代码。

下面是输出:

我尝试java -jar bin/RankLib.jar使用相同的方法()在 Jupyter 中运行 RankLib 库(即)subprocess.run,它工作正常(即返回代码 0)。

导致此错误代码 1 的原因是什么?可能是因为我的数据太大了吗?还是因为我只进行培训而不进行测试和验证?

任何帮助,将不胜感激!

编辑

我刚刚尝试将我的数据切片为 1000 行,但仍然存在返回码 1 问题,因此大数据不是问题。究竟是什么导致了这个问题?