1

下载 Galago 3.5 bin 版本并尝试按照本指南索引wiki-small.corpus。奇怪的是,在尝试运行 build index 命令时,我得到了 .index 文件的 File Not Found 异常。当我明确使用 inputPath 和 indexPath 时,此错误消失了,但现在我得到了此异常-

创建的执行器:org.lemurproject.galago.tupleflow.execution.LocalCheckpointedStageExecutor@69107c05 在没有服务器的情况下运行!使用 --server=true 启用基于 Web 的状态页面。阶段 inputSplit 完成,出现 0 个错误。2014 年 3 月 14 日下午 3:26:01 org.lemurproject.galago.core.parse.UniversalParser 进程信息:处理拆分:/Users/nanz/Downloads/wiki-small.corpus java.lang.RuntimeException:java.lang.reflect .InvocationTargetException 在 org.lemurproject.galago.core.parse.UniversalParser.process(UniversalParser.java:137) 在 org.lemurproject.galago.core.parse.UniversalParser.process(UniversalParser.java:52) 在 org.lemurproject.galago .core.types.DocumentSplit$FileIdOrder$TupleUnshredder.processTuple(DocumentSplit.java:2033) 在 org.lemurproject.galago.core.types.DocumentSplit$FileIdOrder$DuplicateEliminator。lemurproject.galago.core.index.corpus.CorpusReader.(CorpusReader.java:32) at org.lemurproject.galago.core.parse.CorpusSplitParser.(CorpusSplitParser.java:33) ... 16 个以上 Stage parsePostings 完成,出现 1 个错误. java.lang.Exception:java.lang.RuntimeException:java.lang.reflect.InvocationTargetException 线程“main”中的异常 java.util.concurrent.ExecutionException:Stage 抛出异常:在 org.lemurproject.galago.tupleflow.execution.JobExecutor $JobExecutionStatus.waitForStages(JobExecutor.java:1062) 在 org.lemurproject.galago.tupleflow.execution.JobExecutor$JobExecutionStatus.run(JobExecutor.java:971) 在 org.lemurproject.galago.tupleflow.execution.JobExecutor.runWithoutServer(JobExecutor .java:1122) 在 org.lemurproject.galago.tupleflow.execution.JobExecutor.runLocally(JobExecutor.java:

我尝试构建源代码,在这种情况下我也得到了相同的结果。有人可以指出我哪里出错了吗?似乎几乎没有人遇到过这个问题,所以我通过简单的谷歌搜索得到的信息并不多。

4

2 回答 2

1

解决了。万一其他人面临这个问题,我的一个朋友发现 Galago 不能直接在 wiki-small.corpus 文件上工作,因为它试图寻找不存在的 corpus.keys。只需将此 .corpus 文件替换为文档目录,一切都会正常工作。请明确指定 indexPath 和 inputPath 参数。使用“galago build help”查看确切的语法。干杯。

于 2014-03-19T15:29:40.693 回答
0

我知道这已经晚了,但是教科书网站上的 wiki-small.corpus 文件是用旧版本的 galago 构建的,即 1.0 系列,它保存在这个 google 代码库中:https ://code.google.com /p/galagosearch/

Galago 的较新版本(2.0 ... 3.5 ...3.7)是 Sourceforge 上 Lemur 项目下较新开发的一部分,语料库格式已经改变。如果你有一个使用 Galago 3.5 构建的语料库文件,你的命令应该可以工作。

于 2015-03-12T12:26:05.083 回答