我是相当新的程序员。因此,我正在查看来自文件的数据,并且我必须以占用最少处理时间和内存的方式对数据进行排序。我正在考虑的一种方法是实现一个平衡的二进制文件以有序的方式存储数据,以便我可以以非常有效的方式检索相同的数据。为了测试,我以这种方式生成我的日志文件。
import time
import random
JITTER = 275
TICKS = 1000
LINES_PER_TICK = 1000
def log_line(now):
timestamp = now - (random.random() * JITTER)
return "%f City %d" % (timestamp, random.randint(0,10000))
start = time.time()
for tick in xrange(TICKS):
now = start + tick
for num_line in xrange(LINES_PER_TICK):
print(log_line(now))
平衡二叉树是实现此类程序的最佳方法。有没有更好的方法来做同样的事情?谢谢。