python - Python - 对列表列表中的元素进行排序

Question

如果已在其他地方回答此问题，我们深表歉意；我试过搜索，但没有找到任何可以回答我的问题的东西（或者也许我有，但不明白）......

我对 Python（v2.6.2）相当陌生，并且有一个包含浮点值的列表列表，看起来如下所示（除了每个列表的完整内容有 2+ 百万个条目）：

cat = [[152.123, 150.456, 151.789, ...], [4.123, 3.456, 1.789, ...], [20.123, 22.456, 21.789, ...]]

现在我想做的是按第三个列表的元素的升序对所有 3 个列表进行排序，这样我得到：

cat_sorted = [[152.123, 151.789, 150.456, ...], [4.123, 1.789, 3.456, ...], [20.123, 21.789, 22.456, ...]]

我已经尝试了一些东西，但它们没有给我我正在寻找的东西（或者我可能没有正确使用它们）。有没有办法做我正在寻找的东西，如果是这样，什么是最简单和最快的（考虑到我有 3 x 200 万个条目）？有没有办法使用另一个列表对一个列表进行排序？

score 8 · Accepted Answer

这会很痛苦，但是使用默认的 python 你有 2 个选项：

用装饰第一个和第二个列表enumerate()，然后使用索引对它们进行排序以引用第三个列表中的值：
```
cat_sorted = [
    [e for i, e in sorted(enumerate(cat[0]), key=lambda p: cat[2][p[0]])],
    [e for i, e in sorted(enumerate(cat[1]), key=lambda p: cat[2][p[0]])],
    sorted(cat[2])
]
```
尽管它可能有助于cat[2]就地排序而不是使用sorted(); 你无法绕过sorted()其他两个。
zip()将三个列表放在一起，然后对这个新列表的第三个元素进行排序，然后zip()再次返回原始结构：
```
from operator import itemgetter
cat_sorted = zip(*sorted(zip(*cat), key=itemgetter(2)))
```

两者都不会是性能破坏者，而不是具有数百万个数字的普通 python 列表。

score 4 · Accepted Answer

如果你愿意使用额外的库，我建议使用Python Pandas。它有一个类似于 R 的 DataFrame 对象，data.frame并在构造函数中接受一个列表列表，这将创建一个 3 列数据数组。然后您可以轻松地使用内置pandas.DataFrame.sort函数按第三列（升序或降序）排序。

有许多简单的 Python 方法可以做到这一点，但考虑到问题的规模，使用 Pandas 中的优化函数是一种更好的方法。如果您需要从排序数据中获得任何类型的汇总统计信息，那么 Pandas 是不二之选。

score 2 · Accepted Answer

我会采取的一般方法是对整个事物进行schwartzian 变换。

将三个列表压缩成一个元组列表。

使用第三个元素作为键对元组进行排序。

遍历新排序的元组列表并再次填写三个列表。

score 1 · Accepted Answer

为了完成，使用numpy的解决方案：

import numpy as np

cat = [[152.123, 150.456, 151.789],
        [4.123, 3.456, 1.789],
        [20.123, 22.456, 21.789]]

cat = np.array(cat) 
cat_sorted = cat[:, cat[2].argsort()]

print cat_sorted
[[ 152.123  151.789  150.456]
 [   4.123    1.789    3.456]
 [  20.123   21.789   22.456]]

score 0 · Accepted Answer

这里，keys是一个排序的索引列表。

keys = sorted(range(len(cat[2])), key=cat[2].__getitem__)
cat_sorted = [[cat[i][k] for k in keys] for i in range(3)]

score 0 · Accepted Answer

这是基于 Martijn Pieters 和 pcalcao 的出色回答的另一种方法

def sort_by_last(ll):
    """
        >>> sort_by_last([[10, 20, 30], [3, 2, 1]])
        [[30, 20, 10], [1, 2, 3]]

        >>> sort_by_last([[10, 20, 30], [40, 50, 60], [3, 2, 1]])
        [[30, 20, 10], [60, 50, 40], [1, 2, 3]]

        >>> sort_by_last([[10, 20, 30], [40, 50, 60], [1, 1, 1]])
        [[10, 20, 30], [40, 50, 60], [1, 1, 1]]

        >>> sort_by_last([[10, 20, 30], [40, 50, 60], [1, 3, 1]])
        [[10, 30, 20], [40, 60, 50], [1, 1, 3]]

        >>> sort_by_last([[152.123, 150.456, 151.789], [4.123, 3.456, 1.789], [20.123, 22.456, 21.789]])
        [[152.123, 151.789, 150.456], [4.123, 1.789, 3.456], [20.123, 21.789, 22.456]]
    """
    return [sorted(x, key=lambda y: ll[-1][x.index(y)]) for x in ll]

大字符串有一个带有doctest的文档字符串，用于测试函数将其复制到一个文件并运行它 python -m doctest -v <file>

python - Python - 对列表列表中的元素进行排序

6 回答 6

Related

Reference