原因是理论上如果做得好,这个算法可以达到 O(n) 的速度或接近。
所以这是我到目前为止在 python 中所做的:
letters = {'a':0,'b':1,'c':2,'d':3,'e':4,'f':5,'g':6,'h':7,'i':8,'j':9,
def sortlist(listToSort):
listLen = len(listToSort)
newlist = []
for i in listToSort:
k = letters[i[0]]
for j in i[1:]:
k = (k*26) + letters[j]
norm = k/pow(26,len(i)) # get a float hash that is normalized(i think thats what it is called)
# 2nd part
idx = int(norm*len(newlist)) # get a general of where it should go
if newlist: #find the right place from idx
if norm < newlist[idx][1]:
while norm < newlist[idx][1] and idx > 0: idx -= 1
if norm > newlist[idx][1]: idx += 1
while norm > newlist[idx][1] and idx < (len(newlist)-1): idx += 1
if norm > newlist[idx][1]: idx += 1
newlist.insert(idx,[i,norm])# put it in the right place with the "norm" to ref later when sorting
return newlist
我认为第一部分很好,但第二部分需要帮助。所以 Qs 将是做这样的事情的最佳方法,或者甚至有可能从中获得 O(n) 时间(或接近那个时间)?
我对 88,000 个单词列表进行的测试大约需要 5 分钟,10,000 个单词大约需要 30 秒,随着列表计数的增加,情况变得更糟。
如果这个想法真的可行,那么我会用 C 重新编码以获得一些真正的速度和优化。