1

我是新来的。我正在使用 nutch 1.7 并且爬网完成了。我的问题是如何检索爬网数据?在 nutch 1.1 中有一个名为 org.apache.nutch.searcher 的包提供了这个功能。但是如果我在我的 Java 应用程序中导入 nutch1.1.jar 并尝试运行旧代码

http://wiki.apache.org/nutch/JavaDemoApplication(在这个链接上可见)

它给了我这个错误:

java.lang.VerifyError: class org.apache.nutch.indexer.NutchSimilarity overrides final method lengthNorm.(Ljava/lang/String;I)F
    at java.lang.ClassLoader.defineClass1(Native Method)
    at java.lang.ClassLoader.defineClass(ClassLoader.java:792)
    at java.security.SecureClassLoader.defineClass(SecureClassLoader.java:142)
    at java.net.URLClassLoader.defineClass(URLClassLoader.java:449)
    at java.net.URLClassLoader.access$100(URLClassLoader.java:71)
    at java.net.URLClassLoader$1.run(URLClassLoader.java:361)
    at java.net.URLClassLoader$1.run(URLClassLoader.java:355)
    at java.security.AccessController.doPrivileged(Native Method)
    at java.net.URLClassLoader.findClass(URLClassLoader.java:354)
    at java.lang.ClassLoader.loadClass(ClassLoader.java:424)
    at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:308)
    at java.lang.ClassLoader.loadClass(ClassLoader.java:357)
    at org.apache.nutch.searcher.LuceneSearchBean.init(LuceneSearchBean.java:84)
    at org.apache.nutch.searcher.LuceneSearchBean.<init>(LuceneSearchBean.java:51)
    at org.apache.nutch.searcher.NutchBean.<init>(NutchBean.java:103)
    at org.apache.nutch.searcher.NutchBean.<init>(NutchBean.java:78)
    at MyCrawler.main(MyCrawler.java:57)

有任何想法吗?谢谢达尼洛

4

1 回答 1

0

这个错误似乎是因为 Nutch 版本 1.1 和 1.2 与高于 3.1.0 的 Lucene 版本不兼容。我遇到了同样的问题,并通过直接使用 Nutch 和 SOLR 集成而不是 Nutch 和 - Lucene 集成来解决它。你可以看看这个教程: http ://cmusphinx.sourceforge.net/2012/06/building-a-java-application-with-apache-nutch-and-solr/

于 2014-03-14T00:11:06.187 回答