我们正在向现有数据库记录添加额外的登录信息,每次登录大约 3.85KB。
对此有两个担忧:
1) 每次登录是否添加了太多的在线数据?
2) 每次登录时我们在数据库中存储的额外数据是否过多?
鉴于当今的技术,这些担忧是否有效?
背景:
我们没有具体的使用数据,但我们平均每月约有 5,000 次登录。我们希望扩展到更大的客户,但是,仍然是每月 1000 个,而不是每秒 1000 个。
在美国(我们的市场),宽带有 60% 的市场采用率。
我们正在向现有数据库记录添加额外的登录信息,每次登录大约 3.85KB。
对此有两个担忧:
1) 每次登录是否添加了太多的在线数据?
2) 每次登录时我们在数据库中存储的额外数据是否过多?
鉴于当今的技术,这些担忧是否有效?
背景:
我们没有具体的使用数据,但我们平均每月约有 5,000 次登录。我们希望扩展到更大的客户,但是,仍然是每月 1000 个,而不是每秒 1000 个。
在美国(我们的市场),宽带有 60% 的市场采用率。
假设您每月有约 80,000 次登录,您将每年向数据库表添加约 3.75 GB。
如果您使用的是像 MySQL、PostgreSQL、SQLServer、Oracle 等像样的 RDBMS……这是可笑的数据和流量。几年后,您可能想开始考虑归档其中的一些内容。但到那时,谁知道应用程序会是什么样子?
考虑如何查询这些数据始终很重要,这样您就不会遇到性能瓶颈。如果没有这些细节,我无法对这方面做出非常有用的评论。
但要回答您的担忧,请不要担心。只是始终保持超前思考。
你有多少用户?他们必须多久登录一次?他们可能是快速连接,还是潮湿的绳子?您的意思是每次有人登录或每个用户帐户时您真的增加了 3.85K?您需要将数据存储多长时间?它给你带来什么好处?它与您已经存储的数据量相比如何?(也就是说,您的大部分数据是来自这个新部分,还是只是沧海一粟?)
简而言之 - 这是一个非常上下文相关的问题:)
鉴于这些天存储和硬件非常便宜(当然相对而言),这不应该是一个问题。显然,如果您需要数据,那么您就需要数据!您可以使用复制到多个位置,这样添加的数据就不需要通过线路移动那么远(例如西海岸和东海岸的服务器)。您可以通过按状态分隔数据以最小化表的大小来管理数据(类似于银行所做的,选择状态作为登录过程的一部分,以便它们查找正确的数据存储)。您可以使用水平分区来最小化每个表的数量或记录,以保持查询速度。保持大数据优化的许多方法。如果您打算对此数据进行大量读取,还请检查 Lucene。
就存储而言,这是小菜一碟,尽管您最终希望归档或丢弃旧数据。
就网络(?)流量而言,这在服务器端并不多,但它会影响您的网站似乎为大部分客户加载和运行的速度。尽管许多人都有宽带,但有人会在边缘或调制解调器上尝试它,或者在大量使用比特洪流时,您的网站会显得很慢或完全出现故障,并且您会在整个网络上收到很大的抱怨。有关系吗?如果您的用户真的需要您的服务,他们当然可以等待,如果您正在开发新的 twitter,页面加载时间的增加是难以接受的。
就当今的普通服务器技术而言,这不是问题。就您的服务器技术而言,这可能是个问题。您需要提供更多信息。