对于这种规模的数据库,搁置确实是错误的工具。如果您不需要高可用性的客户端/服务器架构,而只想将 TXT 文件转换为本地内存可访问的数据库,那么您真的应该使用ZODB
如果您需要高可用性的东西,您当然需要切换到正式的“NoSQL”数据库,其中有很多可供选择。
这是一个简单的示例,说明如何将您的搁置数据库转换为 ZODB 数据库,这将解决您的内存使用/性能问题。
#!/usr/bin/env python
import shelve
import ZODB, ZODB.FileStorage
import transaction
from optparse import OptionParser
import os
import sys
import re
reload(sys)
sys.setdefaultencoding("utf-8")
parser = OptionParser()
parser.add_option("-o", "--output", dest = "out_file", default = False, help ="original shelve database filename")
parser.add_option("-i", "--input", dest = "in_file", default = False, help ="new zodb database filename")
parser.set_defaults()
options, args = parser.parse_args()
if options.in_file == False or options.out_file == False :
print "Need input and output database filenames"
exit(1)
db = shelve.open(options.in_file, writeback=True)
zstorage = ZODB.FileStorage.FileStorage(options.out_file)
zdb = ZODB.DB(zstorage)
zconnection = zdb.open()
newdb = zconnection.root()
for key, value in db.iteritems() :
print "Copying key: " + str(key)
newdb[key] = value
transaction.commit()