问题标签 [lemur]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 狐猴项目中 IndriRunQuery 的空白输出
我正在将 lemur 用于 nlp 项目,并且我成功地索引了一些数据我想通过 IndriRunQuery 命令参数文件对索引文件运行查询:
没有错误,没有答案。输出中只有一个空行
javascript - JS:在搜索引擎界面拖放图片
我正在构建一个搜索引擎界面。我在狐猴索引中有一些网页原始内容(包括图像)。我想拖放图像并稍后实现图像搜索。我知道如何通过设置 draggable="True" 使图像在 HTML 中可拖动。但更改 Lemur 索引中的原始内容对我来说不是一个好选择。有什么方法可以在我的 main.js 中实现图像拖放?
顺便说一句,我目前通过以下方式实现文本拖放: var selection=document.getElementById('lemurbox').contentWindow.getSelection();
但这似乎只能获取文本,因为拖动图像后选择将为 NULL。
java - What metrics can I use to validate and test RankNet in the RankLib library in the Lemur Project?
I am currently using the RankLib implementation of the RankNet algorithm (-ranker 4) with a held-out set. I am using the jar file in terminal to run this.
The documentation stipulates:
metric2t (e.g. NDCG, ERR, etc) only applies to list-wise algorithms (AdaRank, Coordinate Ascent and LambdaMART). Point-wise and pair-wise techniques (MART, RankNet, RankBoost), due to their nature, always use their internal RMSE / pair-wise loss as the optimisation criteria.
However, when I set the 'metrics2t' to ERR@10 or NDCG@10, it starts to train and validate on my chosen metric rather that 'RMSE'.
This is part of the table outputted when I run RankNet with ERR@10.
Is there something that I am missing as this seems to be a contradiction to me.
Thanks.
information-retrieval - 在 Lemur Indri 上制定布尔查询
我无法使用 Indri 查询语言编写以下布尔查询。我需要编写的查询如下:
我需要包含上述内容的所有文件的列表。我该怎么做呢?
java - Galago 安装失败:JAVA_HOME 未正确定义
我正在尝试通过 unix 上的二进制文件(galago-3.12-bin)安装 Galago。当我运行该文件时,我收到以下错误:
SEF-IS-017660:galago-3.12-bin anton$ bin/galago 错误:未正确定义 JAVA_HOME。我们无法执行 /System/Library/Frameworks/JavaVM.framework/Versions/CurrentJDK/Home/bin/java
当我检查我的 java 主目录时,我得到:
SEF-IS-017660:galago-3.12-bin anton$ echo $(/usr/libexec/java_home) /Library/Java/JavaVirtualMachines/jdk1.8.0_131.jdk/Contents/Home
我该如何纠正这个问题?安装需要某个主目录,但我的不同?
java - 安装 Galago 时出错
嗨,我想从 netbeans IDE 或 Promt 命令行使用 mvn 包安装 Galago 我安装了 maven
但是,当我使用依赖项运行构建时,我收到以下错误消息:
你能帮助我吗?
python - Lemur RankLib 在训练时返回代码 1
我正在使用 RankLib 为我的数据(形状:218279 行 × 1504 列)使用 python 并得到错误代码 1,没有输出。我只是想知道关于 RankLib 上的错误代码是否有任何文档?
我正在为我的项目使用 Jupyter iPython,并使用 subprocess.run 运行该过程。如果您想知道,下面是我的训练代码。
下面是输出:
我尝试java -jar bin/RankLib.jar
使用相同的方法()在 Jupyter 中运行 RankLib 库(即)subprocess.run
,它工作正常(即返回代码 0)。
导致此错误代码 1 的原因是什么?可能是因为我的数据太大了吗?还是因为我只进行培训而不进行测试和验证?
任何帮助,将不胜感激!
编辑
我刚刚尝试将我的数据切片为 1000 行,但仍然存在返回码 1 问题,因此大数据不是问题。究竟是什么导致了这个问题?