那么集群背后的想法是什么?
您有多台机器具有相同的数据库副本,您在其中传播读/写?这个对吗?
这个想法如何运作?当我进行选择查询时,集群会分析哪个服务器的读/写较少并将我的查询指向该服务器?
当您应该开始使用集群时,我知道这是一个棘手的问题,但也许有人可以给我举个例子,比如 100 万次访问和 1 亿行数据库。
那么集群背后的想法是什么?
您有多台机器具有相同的数据库副本,您在其中传播读/写?这个对吗?
这个想法如何运作?当我进行选择查询时,集群会分析哪个服务器的读/写较少并将我的查询指向该服务器?
当您应该开始使用集群时,我知道这是一个棘手的问题,但也许有人可以给我举个例子,比如 100 万次访问和 1 亿行数据库。
1)正确。每个数据节点不保存集群数据的完整副本,但每一位数据都存储在至少两个节点上。
2)基本正确。MySQL Cluster 支持分布式事务。
3)当垂直扩展不再可能,复制变得不切实际时:)
正如所承诺的,一些推荐读物:
MySQL 中的循环复制(关于冲突的高级警告)
MySQL Cluster Multi-Computer How-To(分步教程,它假设有多台物理机器,但您可以按照这些说明在同一台机器上运行所有进程来运行测试)
MySQL 性能博客是该领域的参考资料
1->您的第一点在某种程度上是正确的。但我认为如果多台机器共享相同的数据,它将是复制而不是集群。在聚类中,数据是在各个机器之间进行划分的,水平划分是指数据的划分是基于行,记录在这些机器之间通过某种算法进行划分。
数据的划分是以这样一种方式完成的,即每条记录都将获得一个唯一的键,就像键值对的情况一样,每台机器也有一个唯一的 machine_id 相关的,用于定义哪个键值对去哪个机器。
我们称每台机器为一个集群,每个集群由一个单独的 mysql-server、单独的数据和一个集群管理器组成。所有集群节点之间也存在数据共享,因此所有数据随时可供每个节点使用.
数据的检索是通过 memcached 设备/服务器完成的,以便快速检索,并且还有一个用于特定集群的复制服务器来保存数据。
2->是的,有可能因为所有集群节点之间共享所有数据。你也可以使用负载均衡器来平衡负载。但是负载均衡器的想法很普遍,因为大多数服务器都在使用它们。但是,如果您只是为了您的知识而尝试,那么没有必要,因为您不会注意到创建负载均衡器要求的负载类型,集群管理器本身可以完成整个事情。
3->RandomSeed 是对的。当您的复制变得不切实际时,您确实觉得需要集群意味着如果您使用主服务器进行写入并使用从属服务器进行读取,那么在某个时间流量变得巨大以至于服务器无法顺利工作时,您将感觉需要集群。只是为了加快整个过程。这不是唯一的情况,这只是其中一种情况,这只是一种情况。
希望这对你有帮助!!