我正在尝试使用 Elastica API 将 1000 万个文档索引到我的 Elasticsearch 索引中。我在具有 16G RAM 和 8 个内核的 Ubuntu 服务器上运行我的脚本。
到目前为止,我不能索引超过 250000 个文档。我的脚本正在中断并返回一个未知错误。
有人可以向我描述确保对这些数据量进行索引的步骤吗?
我在这里找到了一个与我类似的问题,但答案对我来说似乎不是很清楚。
编辑 :
我已经运行了Nate从这里建议的索引脚本,我得到了以下输出:
close index
{
"acknowledged" : true
}
refresh rate
{
"acknowledged" : true
}
merge policy
{
"acknowledged" : true
}
replicas
{
"acknowledged" : true
}
flush
{
"acknowledged" : true
}
buffer
{
"acknowledged" : true
}
{
"acknowledged" : true
}
PS:我稍微修改了脚本以提高输出的可见性
编辑 2: 我已经从 Elastica 切换到使用elasticsearch-jdbc-river,现在它索引了大约 500 万个,但仍然不是整个数据库。