我有大约 20,000 个包含 JSON 数组的文件。我想将所有这些文件转储到本地托管的 MongoDB 中。我为此目的使用 mongoimport 。
有什么办法可以加快这个过程吗?
这 20,000 个文件包含大约 1200 万条记录。
我有大约 20,000 个包含 JSON 数组的文件。我想将所有这些文件转储到本地托管的 MongoDB 中。我为此目的使用 mongoimport 。
有什么办法可以加快这个过程吗?
这 20,000 个文件包含大约 1200 万条记录。
我的 Mongo 版本是 32 核的 linux 服务器中的 2.6.12。我已将 1.34 亿条记录导入 MongoDB。输入文件的数量在 1700 左右,格式为 JSON 数组。我的测试结果如下:
原因可能在于:具有 100K 记录的文件是一个大块,“mongoimport”处理起来很耗时。我还没弄清楚为什么 PyMongo 比 mongoimport 快。JSON 文件的处理速度更快吗?因此,您可以尝试以多线程方式使用 PyMongo。