警告 - 我是 MongoDB 和 JSON 的新手。
我有一个包含 JSON 数据集的日志文件。单个文件在捕获点击流数据时具有多种 JSON 格式。这是一个日志文件的示例。
[
{
"username":"",
"event_source":"server",
"name":"course.activated",
"accept_language":"",
"time":"2016-10-12T01:02:07.443767+00:00",
"agent":"python-requests/2.9.1",
"page":null,
"host":"courses.org",
"session":"",
"referer":"",
"context":{
"user_id":null,
"org_id":"X",
"course_id":"3T2016",
"path":"/api/enrollment"
},
"ip":"160.0.0.1",
"event":{
"course_id":"3T2016",
"user_id":11,
"mode":"audit"
},
"event_type":"activated"
},
{
"username":"VTG",
"event_type":"/api/courses/3T2016/",
"ip":"161.0.0.1",
"agent":"Mozilla/5.0",
"host":"courses.org",
"referer":"http://courses.org/16773734",
"accept_language":"en-AU,en;q=0.8,en-US;q=0.6,en;q=0.4",
"event":"{\"POST\": {}, \"GET\": {}}",
"event_source":"server",
"context":{
"course_user_tags":{
},
"user_id":122,
"org_id":"X",
"course_id":"3T2016",
"path":"/api/courses/3T2016/"
},
"time":"2016-10-12T00:51:57.756468+00:00",
"page":null
}
]
现在我想将这些数据存储在 MongoDB 中。所以这是我的新手问题:
- 在存储到 MongoDB 之前,我是否需要解析文件然后将其拆分为 2 个数据集?如果是,那么这里是否有一个简单的程序来执行此操作,因为我的文件具有多种数据集格式?
- MongoDB中是否有一些魔术可以在我们上传时拆分各种数据集?