我正在使用 ElasticSearch 来索引一些数据。但是我发现性能并不是那么高效。
只有 3000 个条目数据,每个数据有 6 列。索引这 3000 个条目需要 5 分钟。
因为我是 ElasticSearch 的新手,所以我的代码和程序流程基本如下:
- 搜索并检查是否有任何相同的数据。
- 如果有相同的数据,则更新。
- 如果没有,然后添加。
代码如下:
conn = pyes.ES('server:9200')
搜索:
searchResult = conn.search(searchDict, indexName, TypeName)
指数
conn.index(storeDict, indexName, TypeName, id)
更新索引数据中的计数。
conn.partial_update(indexName, TypeName, id, "ctx._source.Count += counter", params={"counter" : 1})
有什么方法可以提高我的代码性能吗?
谢谢您的帮助。