问题标签 [lemur]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1484 浏览

gcc - 为什么 make 命令给出错误以及如何修复它?

我必须将这个程序 Lemur 用于某些硬件,但我在安装它时遇到了麻烦,因为我从未使用过 Linux。我下载了 cygwin 并运行了看起来运行良好的 ./configure。当我尝试 make 命令时,我遇到了一些我很难解释的问题,即使是在环顾四周假设的类似问题之后也是如此。
使用 Lemur 工具包在 cygwin 上出错

不用说,当我稍后尝试 make install 命令时,这会导致问题。

任何帮助将不胜感激。

0 投票
1 回答
96 浏览

search - 狐猴 CGI 的配置问题

我正在尝试启动并运行一个简单的狐猴 CGI,但是当我在浏览器中导航到 lemur.cgi 时,我收到 500 服务器配置错误。

内部服务器错误

服务器遇到内部错误或配置错误,无法完成您的请求。

请联系服务器管理员 root@localhost 并告知他们错误发生的时间,以及您所做的任何可能导致错误的事情。

服务器错误日志中可能提供有关此错误的更多信息。

我通过在~/indri_test/param_files/. 这创建了一个与索引同名的子目录,./krovetz_stop.

我可以毫无问题地使用 IndriRunQuery 手动查询索引。

我按照教程设置了 CGI,我执行了以下步骤:

然后我更新了lemur.config文件~/public_html以指向我的索引(更正式地说,我将它指向在我构建索引时创建的子目录,因为否则我不确定“索引路径”是什么)。这是我的 lemur.config 文件:

据我所知,一切都应该有效,但事实并非如此。也许我需要用自动工具重建 CGI?任何想法我可以采取哪些步骤来调试问题?也许我没有使用正确的索引路径?我需要修改索引目录的权限吗?

谢谢

0 投票
2 回答
534 浏览

search-engine - Galago 3.5 索引

下载 Galago 3.5 bin 版本并尝试按照本指南索引wiki-small.corpus。奇怪的是,在尝试运行 build index 命令时,我得到了 .index 文件的 File Not Found 异常。当我明确使用 inputPath 和 indexPath 时,此错误消失了,但现在我得到了此异常-

创建的执行器:org.lemurproject.galago.tupleflow.execution.LocalCheckpointedStageExecutor@69107c05 在没有服务器的情况下运行!使用 --server=true 启用基于 Web 的状态页面。阶段 inputSplit 完成,出现 0 个错误。2014 年 3 月 14 日下午 3:26:01 org.lemurproject.galago.core.parse.UniversalParser 进程信息:处理拆分:/Users/nanz/Downloads/wiki-small.corpus java.lang.RuntimeException:java.lang.reflect .InvocationTargetException 在 org.lemurproject.galago.core.parse.UniversalParser.process(UniversalParser.java:137) 在 org.lemurproject.galago.core.parse.UniversalParser.process(UniversalParser.java:52) 在 org.lemurproject.galago .core.types.DocumentSplit$FileIdOrder$TupleUnshredder.processTuple(DocumentSplit.java:2033) 在 org.lemurproject.galago.core.types.DocumentSplit$FileIdOrder$DuplicateEliminator。lemurproject.galago.core.index.corpus.CorpusReader.(CorpusReader.java:32) at org.lemurproject.galago.core.parse.CorpusSplitParser.(CorpusSplitParser.java:33) ... 16 个以上 Stage parsePostings 完成,出现 1 个错误. java.lang.Exception:java.lang.RuntimeException:java.lang.reflect.InvocationTargetException 线程“main”中的异常 java.util.concurrent.ExecutionException:Stage 抛出异常:在 org.lemurproject.galago.tupleflow.execution.JobExecutor $JobExecutionStatus.waitForStages(JobExecutor.java:1062) 在 org.lemurproject.galago.tupleflow.execution.JobExecutor$JobExecutionStatus.run(JobExecutor.java:971) 在 org.lemurproject.galago.tupleflow.execution.JobExecutor.runWithoutServer(JobExecutor .java:1122) 在 org.lemurproject.galago.tupleflow.execution.JobExecutor.runLocally(JobExecutor.java:

我尝试构建源代码,在这种情况下我也得到了相同的结果。有人可以指出我哪里出错了吗?似乎几乎没有人遇到过这个问题,所以我通过简单的谷歌搜索得到的信息并不多。

0 投票
1 回答
225 浏览

c++ - 我想将 LEMUR 库与 QT 一起使用

我想将 LEMUR 库与 QT 一起使用,但我需要一些帮助。我那里有说明:说明

makeFile.app 包含:

最后我写了 QT4 作为我的程序和 main.cpp 作为我的对象,但它不起作用。当我运行 make -f MakeFile.app 时,我的终端出现错误

main.cpp:1:35:致命错误:QtCore/QCoreApplication:没有关于这种类型的文件或文件夹

如果我使用带有 QT 的构建按钮进行编译,则会出现此错误:

在我的 QT 项目中,我只有一个 .pro 文件和 main.cpp 在我的 .pro 文件中,我有库和路径

主文件

任何人都可以帮助我吗?

感谢

0 投票
1 回答
209 浏览

information-retrieval - IndriUI 索引未建立

我正在尝试使用 Indri UI 构建索引。我创建了用于构建索引的参数文件和停用词列表。当我单击构建索引时,UI 会持续构建很长时间,并且永远不会构建索引。

在此处输入图像描述

UI挂在这里,

在此处输入图像描述

这是我的 input.txt 文件,

这是我的 stopwords.txt,

我错过了什么吗?请帮助我,我是 IR 的新手。我不知道参数文件。我创建了一个,但我不确定它在哪里使用。

0 投票
1 回答
76 浏览

python - 手动保存的文本文件和使用 Python 编解码器的差异:Lemur Malformed document

我正在使用 Python 编解码器将一些 UTF-8 文本写入文件

现在,如果我在包含此文件的目录上运行 Lemur ( http://www.lemurproject.org/ ),Lemur 会告诉我该文档“格式错误”。

但是,如果我在 gedit 中打开文件,添加一个随机字符并将其删除(以便文件内容保持不变),然后保存文件,那么如果我运行 Lemur,它会完美运行。

那么,通过 Python 和 gedit 保存文本文件的方式是否存在差异,因为 Lemur 在两种不同情况下的响应不同?

0 投票
1 回答
418 浏览

information-retrieval - 在 Galago 中使用停用词删除索引集合

我使用 Galago 成功索引了一个集合。我没有找到任何用于删除索引的停用词的参数。galago 会自动删除停用词吗?如果不是,我如何将停用词列表传递给 Galago,以及如何告诉 Galago 删除停用词?

0 投票
1 回答
232 浏览

search-engine - 获取 Galago 中的词汇表

我正在使用 Galago 检索工具包(Lemur 项目的一部分),我需要有一个集合中所有词汇术语的列表(所有唯一术语)。实际上我需要一个List <String>或者Set <String>我真的很感激让我知道如何获得这样的列表?

0 投票
1 回答
298 浏览

information-retrieval - 在 Galago 搜索引擎中使用 LDA

我已经开始使用Galago进行文档检索。我想使用 LDA 对一些文档(最初检索到的任何模型的文档)进行聚类。我更喜欢使用基于 java 的实现,它可以使用 Galago 集成到我的代码中。如果您能让我知道 LDA 的哪种开源实现更适合我的目的,我将不胜感激。

预先感谢您的帮助!

0 投票
1 回答
361 浏览

linux - 在 Linux 机器上安装狐猴

我正在尝试在 Linux 上安装 Lemur-4.12,但是在运行 make 时我得到:

这是一个常见问题吗?它可能是由什么引起的,我该如何解决?