我想编写一个脚本来将 DataImportHandler 的结果与 ETL 过程中的早期结果进行比较。我在 solr 中使用的网址是:
http://HOSTNAME:PORT/solr/#/CORENAME/dataimport//dataimport
原始状态输出有一个很好的 JSON 输出,其中包含我需要的信息(获取的文档等),但我无论如何都找不到只返回这个 JSON 输出。有什么论据我可以给出 URL 或其他东西吗?因为它是我无法解析页面以获取我需要的信息。
我想编写一个脚本来将 DataImportHandler 的结果与 ETL 过程中的早期结果进行比较。我在 solr 中使用的网址是:
http://HOSTNAME:PORT/solr/#/CORENAME/dataimport//dataimport
原始状态输出有一个很好的 JSON 输出,其中包含我需要的信息(获取的文档等),但我无论如何都找不到只返回这个 JSON 输出。有什么论据我可以给出 URL 或其他东西吗?因为它是我无法解析页面以获取我需要的信息。
您可以使用LukeRequestHandler来获取索引的状态。
如果你设置numTerms=0
你得到一个最小的输出,最后一个索引时间。
为了获得 json 输出,您可以附加wt=json&json.nl=map
到您的 SOLR 请求查询字符串。
您可以通过以下方式获得它:http://<host>:<port>/solr/dataimport?command=status&wt=json
如果您想要一个漂亮的打印输出,请将响应的正文通过管道传输到python -mjson.tool