问题标签 [indexwriter]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
elasticsearch - Nutch Elasticsearch 索引器插件
我在 nutch seed.txt 文件中有很多 url, http://www.foodurl1.com,http://www.foofurl2.com等。我想将 ES 中的所有 URL 编入单个索引下,例如 foodindex,每个 url 为单独的类型,例如 foodindex/foodurl1、foodindex/foodurl2。所以我可以根据类型单独搜索每个网址。是否有任何开箱即用的方式在 ES 索引器插件中传递 elasticindexwriter.java 中的类型(默认情况下它使用“doc”类型)。
或任何其他实现此要求的建议。
java - Python lucene函数将字段内容添加到文档不起作用
我正在使用 python lucene 索引 url 页面。
我在尝试向文档添加字段时遇到了一些错误。我不确定为什么。错误说:
JavaError: , > Java stacktrace: java.lang.IllegalArgumentException: 有一个既没有索引也没有存储在 org.apache.lucene.document.Field.(Field.java:249) 的字段没有意义
在我放的地方: doc.add(Field("contents", text, t2))
我使用的python代码是:
lucene - Lucene IndexWriter 已经设置异常
我正在尝试创建一个 IndexWriter 并写入一个 Lucene 索引。这是我的代码:
但是在尝试创建 IndexWriter 时,我不断遇到异常:
我究竟做错了什么?代码编译完美。我正在使用 Lucene.NET,但我猜它也应该适用于 Java。
elasticsearch - 自定义 nutch 索引器以将值映射到弹性文档 multielvel(如 JSON)
我打算为 apache nutch 开发一个插件来自定义 indexwriter,我的问题是在插件中当你可以访问 NutchDocument 时,你只是将数据放在第一级而不是第二级。例如,对于“a”、“location”和“url”,您可以轻松地将数据放在doc.add("url", "www.csad.com");
“company”中,而“company”是一个复杂的对象,不可能发送公司类的对象。
这是我在弹性搜索中的 idnex_Metadata
我无法在 java 插件中将数据发送到“公司”,而没有公司它运行良好