0

我有一个包含大约 470 个键/值对的字典,其中的值是一个嵌套列表。它看起来像这样:

{'sample1': [0.052333365, 0.048546686, 0.037446034, 0.034170007, 0.027255262, 0.014583427, 0.022703695, 0.02747237, 0.036779904, 0.047089636, 0.068311633, 0.131601903, 0.213325007, 0.262173714], 
'sample2': [0.499261188, 0.569225594, 0.971341941, 0.983553048, 1.047320154, 1.214003077, 1.382066271, 1.332965957, 1.353788699, 1.224310364, 1.27942017, 1.297752738, 1.215054777, 1.336544035], 
'sample3': [3.015670427, 3.608257648, 3.060244617, 2.879527679, 2.720453311, 2.889312783, 2.899236274, 2.762219639, 3.257009779, 3.113135178, 3.312874684, 3.328944661, 3.564360549, 3.480976541]}

由于访问数据的客户端的基于行的(示例)焦点,它最初是这样创建的。每个指数都是相隔 2 个月进行的测量。

最近,这在本质上变得更加柱状,我收到了关于可以在特定的 2 个月内跨所有样本学习的问题。

我的问题是,是否有一种简单的方法可以为所有样本提取索引 [1] 或 [5] 中的值,并且仍然能够识别值来自哪个样本,而无需将数据重新创建到二维列表中?

4

3 回答 3

1

有没有一种简单的方法可以为所有样本提取索引 [1] 或 [5] 中的值,并且仍然能够识别值来自哪个样本,而无需将数据重新创建到二维列表中?

你可以使用字典理解

假设您的示例字典存储在一个名为的变量中data,我们要提取第 6 个位置的值

row_5 = {k: v[5] for k, v in data.items()} 
# row_5 prints
{'sample1': 0.014583427, 'sample2': 1.214003077, 'sample3': 2.889312783}

您可以构建一个函数以通用方式执行此操作。

def get_row(row_num, data_dict):
    return {k: v[row_num] for k, v in data_dict.items()}

如果您想要更多数据处理功能,我建议您查看 pandas 库。

于 2019-05-19T03:36:54.553 回答
1

您可以使用字典items()和索引值:

for k, v in d.items():
    print(f'{k} -> {v[1]}, {v[5]}')

d你的字典在哪里。

对于给定的输入,输出:

sample1 -> 0.048546685999999999, 0.014583426999999999
sample2 -> 0.56922559399999995, 1.2140030770000001
sample3 -> 3.6082576479999999, 2.8893127829999998
于 2019-05-19T03:33:07.003 回答
0

我们可以使用字典推导来重新创建仅包含来自指定索引的数据的字典。

def get_data(dct, indexes):

    #Iterate through value list and collect element from specified indexes
    return {key: [value[idx] for idx in indexes] for key, value in dct.items()}

所以对于索引[1,5],输出将是

print(get_data(dct, [1,5]))
#{'sample1': [0.048546686, 0.014583427], 'sample2': [0.569225594, 1.214003077], 'sample3': [3.608257648, 2.889312783]}
于 2019-05-19T04:08:08.833 回答