我在熊猫中有这些数据
data = [
['ID', 'Time', 'oneMissing', 'singleValue', 'empty', 'oneEmpty'],
['CS1-1', 1, 10000, None, None, 0],
['CS1-2', 2, 20000, 0.0, None, 0],
['CS1-1', 2, 30000, None, None, 0],
['CS1-2', 1, 10000, None, None, None],
['CS1-11', 1, None, 0.0, None, None],
['CS1-2', 3, 30000, None, None, None]
]
我尝试按 ID 和 Time 列排序,所以结果应该像
'CS1-1', 1, 10000, None, None, 0
'CS1-1', 2, 30000, None, None, 0
'CS1-2', 1, 10000, None, None, None
'CS1-2', 2, 20000, 0.0, None, 0
'CS1-2', 3, 30000, None, None, None
'CS1-11', 1, None, 0.0, None, None
]
我正在使用 pandas 数据框进行排序,也与 natsort 一起尝试过,但我无法让它工作。要么我得到索引包含重复项的错误(我使用 ID 作为索引),要么它按字符串值排序。
这里的 ID 只是一个例子。我不知道它会是什么格式,它可能是 NUMBER-LETTER 或 NUMBER LETTER NUMBER。我只需要将所有数字作为一个数字进行比较。我看过“natsort”,这似乎对数组是正确的。所以我认为应该可以使用它来对 ID 进行排序,然后重新索引数据。
我查看了多个类似的来源,但没有任何运气: Alphanumeric sort Sort dataframes