我有一个要求,我需要从文本文件中解析 JSON 对象并将它们保存到 MongoDB 中。
一些细节 -
- 文件大小 ~ 1-10 MB,#json 对象 ~ 100 k,因此单个 json 对象的大小非常小..
- Mongodb 集群(分片和复制)
- 性能 - 时间非常宝贵。
- 除非我解析并验证整个文件,否则我无法将任何对象转储到我的 mongodb 集合中。
- 我的应用程序使用 J2EE 堆栈(Spring 3.2)
所以现在我有一百万个 Java 对象,在批量插入到 mongodb 之前我需要存储这些对象..(mongodb 是分片的..所以我必须预先拆分以获得更好的性能等)
我的问题是如何提高效率?我想到的一些方法——
- 序列化对象并将其存储到文件中。(问题:IO时间)
- 在独立的非分片 mongo 上创建一个临时集合,然后批量插入所需的集合(看起来比 #1 更好)。
任何人都可以分享她对类似问题的经验..?如果需要任何其他信息,请告诉我..