3

我在 Ubuntu 环境下使用 PHP 和 MySQL 作为社交网络系统。

我有一个名为 的 MySQL 表user_feed,在这个表中,我将每个用户的提要保存为 feed_id,我在 MySQL 中的表结构是:

    |user_feed_id | user_id | content_id | seen |

我有一个表格user_follow,其中包含每个用户关注的数据,所以每个用户都有他/她关注的内容的记录集。

表结构:

follow_id | user_id  | content_id | 

在 user_feed 表中,我有超过 1.7 亿条记录,每个用户都有一组记录,在user_follow表中我有超过 500 000 条记录。

我目前正在从 MySQL 迁移到 MongoDB。所以我需要将此表转换为 MongoDB 中的集合。我想为以下内容建立我的user_feed收藏user_follow

为每个用户创建集合,该集合包含三个文档,一个用于关注 ID,另一个用于 feed_ids,因此当我处理用户配置文件时,我将为每个成员运行一个集合的查询:

每个集合名称都引用 user_id,如:

user_id_1 as collection name

            { user_id: '1'}
            {
                feed_ids: [
                 { content_id: '10', 'seen' : 1 },
                 { content_id: '11', 'seen' : 0 },
                 { content_id: '12', 'seen' : 1 },
                 { content_id: '13', 'seen' : 1 }
              ] 
            }
            {
             follow_ids: [
                 { content_id: '10' },
                 { content_id: '20'},
                 { content_id: '23'},
                 { content_id: '24'}
             ]
           }


user_id_2 as collection name

            { user_id: '2'}
            {
                feed_ids: [
                 { content_id: '14', 'seen' : 1 },
                 { content_id: '15', 'seen' : 0 },
                 { content_id: '16', 'seen' : 0 },
                 { content_id: '17', 'seen' : 0 }
              ] 
            }
            {
             follow_ids: [
                 { content_id: '22' },
                 { content_id: '23'},
                 { content_id: '24'},
                 { content_id: '25'}
             ]
           }

所以如果我有70 000 个用户,那么我需要在MongoDB中创建70 000 个集合

我还有另一个选择来创建它:

一个集合的所有用户提要,每个用户在集合中都有一个文档,例如:

{
        user_id: '1',
        feed_ids: [
            { content_id: '10'},
            { content_id: '11'},
            { content_id: '12'}
        ],

        follow_ids: [
            { content_id: '9'},
            { content_id: '11'},
            { content_id: '14'}
        ]
    }

并且这些表中的数据增长非常显着,我需要集合和文档能够执行所有操作,例如(插入、更新、选择、..)

我的 feed_ids 和 follow_ids 增长非常显着,我的查询是:

select content_id from user_feed where user_id =1 limit 10 offset 20;

update user_feed set seen = 1 where user_id =1

select count(content_id) from user_feed where seen = 0;

select content_id from user_follow where user_feed_id =1 limit 10 offset 20;

insert into user_feed (user_id,content_id,seen) values (1,23,0); 

第一个选项是我的用例的最佳解决方案还是第二个?

谢谢。

4

1 回答 1

2

由于nssize限制(2GB),每个用户的一个集合永远不会扩展,因为这意味着每个数据库限制为 300 万用户(假设数据库只包含用户......)。一旦你开始在多个数据库上跨越这样的事情,那么你就真的开始遇到实现问题了。

此设置没有性能优势,因为主要优势是锁定并且在数据库级别。我仍然认为我在上面段落中的第一点会保留锁,即使它是按集合实现的。作为补充说明,由于 MongoDB 在更新未绑定数组时处理单个文档的方式,您将无法有效利用空间,这将产生“瑞士奶酪”效应并导致大量碎片进一步降低性能。

因此,仅基于此,不,我不会为每个用户制作一个集合。

于 2013-09-08T21:10:51.910 回答