我正在用 Python 开发一个需要存储(非常)大数据集的应用程序。pickle 是存储数据并根据请求检索数据的最实用方法,还是我应该考虑使用 SQL 代替?我的主要目标是速度和尽可能小的处理压力。
我担心的是 pickle 必须动态处理整个大文件,这可能会对性能产生不利影响。除了使用之外,我对泡菜并不是特别熟悉,所以任何关于它如何工作的解释都会很棒。
现在,我正在使用这段代码:
users = pickle.load( open( "users.py", "rb" ) )
username = raw_input("Please enter a username: ")
password = raw_input("Please enter a password: ")
var = username in users
if(var == 0):
return 0
exit()
else:
if(users[username] != password):
return 0
exit()
else:
return 1
exit()
映像用户包含 100 万个条目,这将更有效,还是 SQL?
任何帮助都会很棒,
谢谢