我开始在 CouchDB 上工作,从 Facebook Insights 和其他来源收集分析信息。我不确定文档的正确设计,并希望更有经验的 CouchDB 用户看到它,并在我即将犯任何大错误时警告我。
{
"_id": "0b69a33807d4cb63680dbebc16000af5",
"_rev": "1-7c9916592c377e32cf83acf746a8647c",
//array of metrics, one element per facebook page, around 10 pages per document**
"metrics": [
{
"sourceId": "210627525692699", //facebook page ID
"source": "facebook",
"values": {
"page_likes": 53
//many more other metrics, around 100
}
},
{
"sourceId": "354413697924499", // //facebook page ID
"source": "facebook",
"values": {
"page_wall_posts_source_unique": {other: 0, composer: 1},
"page_likes": 12
//many more other metrics, around 100
}
}
],
"timestamp": [
2012,
10,
15,
10,
0,
0
],
"customerId": "71ff942f-9283-4916-ab84-4927bce09117"
}
预期文件数量:每小时+10 000,每天+240 000。
对文件的预期要求:
- 给定时间段内每个客户、每个 sourceId、每个指标的值总和
- 更复杂指标的专用视图
问题:
- 为了获得一些复杂指标的分析(如 page_wall_posts_source_unique),我们需要构建专门的视图,可能其中有很多,我应该预期视图更新时间会出现问题吗?
- 使用数组作为时间戳是正确的决定,还是使用 long 更好?
- 我应该使用一个设计文档还是将每个视图都放入一个新文档中?