5

我有一些文件需要按名称排序,可惜我不能使用常规排序,因为我也想对字符串中的数字进行排序,所以我做了一些研究,发现我要找的东西叫做自然排序

我尝试了这里给出的解决方案,效果很好。

PresserInc-1_10.jpg但是,对于像and这样的字符串PresserInc-1_11.jpg会导致特定的自然键算法失败,因为它只匹配第一个整数,在这种情况下是1and 1,所以它会抛出排序。所以我认为可能有帮助的是匹配字符串中的所有数字并将它们组合在一起,所以如果我有PresserInc-1_11.jpg算法应该给我111回来,所以我的问题是,这可能吗?

以下是文件名列表:

files = ['PresserInc-1.jpg', 'PresserInc-1_10.jpg', 'PresserInc-1_11.jpg', 'PresserInc-10.jpg', 'PresserInc-2.jpg', 'PresserInc-3.jpg', 'PresserInc-4.jpg', 'PresserInc-5.jpg', 'PresserInc-6.jpg', 'PresserInc-11.jpg']

4

2 回答 2

12

谷歌:Python 自然排序

结果 1:您链接到的页面。

但不要停在那里!

结果 2:Jeff Atwood 的博客解释了如何正确执行。

结果 3:我根据 Jeff Atwood 的博客发布的答案。

这是该答案的代码:

import re

def natural_sort(l): 
    convert = lambda text: int(text) if text.isdigit() else text.lower() 
    alphanum_key = lambda key: [convert(c) for c in re.split('([0-9]+)', key)] 
    return sorted(l, key=alphanum_key)

您的数据的结果:

PresserInc-1.jpg
PresserInc-1_10.jpg
PresserInc-1_11.jpg
PresserInc-2.jpg
PresserInc-3.jpg
ETC...

在线查看它:ideone

于 2012-06-22T04:57:53.940 回答
3

如果您不介意第三方库,可以使用natsort来实现。

>>> import natsort
>>> files = ['PresserInc-1.jpg', 'PresserInc-1_10.jpg', 'PresserInc-1_11.jpg', 'PresserInc-10.jpg', 'PresserInc-2.jpg', 'PresserInc-3.jpg', 'PresserInc-4.jpg', 'PresserInc-5.jpg', 'PresserInc-6.jpg', 'PresserInc-11.jpg']
>>> natsort.natsorted(files)
['PresserInc-1.jpg',
 'PresserInc-1_10.jpg',
 'PresserInc-1_11.jpg',
 'PresserInc-2.jpg',
 'PresserInc-3.jpg',
 'PresserInc-4.jpg',
 'PresserInc-5.jpg',
 'PresserInc-6.jpg',
 'PresserInc-10.jpg',
 'PresserInc-11.jpg']
于 2014-05-06T05:26:29.120 回答