1

我正在尝试将 pandas 数据框转换为字典,但我需要一种指定的输出格式,我一直在阅读和审查许多其他答案,但我无法解决;我的数据框看起来像:

   label   Min   Max   Prom    Desv. Est.  Cr    Tz    Cpk     Zup   Zlow    PPM    % OOS  # Datos
0  test1  1.25  1.46  1.329      0.0426  1.161 -0.023  0.697  2.090  3.077  19354      2      268
1  test2  4.80  5.50  5.110      0.1368  0.774 -1.097  0.926  2.778  4.972   2735      0      268
2  test3  2.58  2.96  2.747      0.0709  0.760 -1.029  0.973  2.918  4.977   1762      0      268

我已经尝试过这个(和其他选项,但这与期望输出最相似):

dict = df.set_index('label').groupby('label').apply(lambda g: g.values.tolist()).to_dict()

我得到了:

{'test1': [[1.25, 1.46, 1.329, 0.0426, 1.161, -0.023, 0.697, 2.09, 3.077, 19354.0, 2.0, 268.0]],
 'test2': [[4.8, 5.5, 5.11, 0.1368, 0.774, -1.097, 0.926, 2.778, 4.972, 2735.0, 0.0, 268.0]],
 'test3': [[2.58, 2.96, 2.747, 0.0709, 0.76, -1.0290, 0.973, 2.918, 4.977, 1762.0, 0.0, 268.0]]}

但我正在寻找的是类似的东西:

{'label':'test1', 'cols':[1.25, 1.46, 1.329, 0.0426, 1.161, -0.023, 0.697, 2.09, 3.077, 19354.0, 2.0, 268.0]},
{'label':'test2', 'cols': [4.8, 5.5, 5.11, 0.1368, 0.774, -1.097, 0.926, 2.778, 4.972, 2735.0, 0.0, 268.0]}, 
{'label':'test3', 'cols': [2.58, 2.96, 2.747, 0.0709, 0.76, -1.0290, 0.973, 2.918, 4.977, 1762.0, 0.0, 268.0]}

非常感谢您的任何想法或建议。

4

2 回答 2

1

您可以使用 lambda 函数来构建所需的输出:

df.apply(lambda x: {'label':x.label, 'cols': x.tolist()[1:]}, axis=1).tolist()
于 2020-01-06T00:27:11.137 回答
0

好吧,从字面上看你的问题的标题,总是有.to_dict()

>>> df = pd.DataFrame([dict(a=1, b=2), dict(a=3, b=4), dict(a=5, b=6)])
>>> df
   a  b
0  1  2
1  3  4
2  5  6
>>> df.to_dict()
{'a': {0: 1, 1: 3, 2: 5}, 'b': {0: 2, 1: 4, 2: 6}}

但是您的示例表明您正在寻找字典列表,这可能由iterrowsitertuples方便地生成:

>>> df = pd.DataFrame([dict(a=1, b=2), dict(a=3, b=4), dict(a=5, b=6)])
>>> df
   a  b
0  1  2
1  3  4
2  5  6
>>> 
>>> for i, row in df.iterrows():
...   print(dict(row), list(row))
... 
{'a': 1, 'b': 2} [1, 2]
{'a': 3, 'b': 4} [3, 4]
{'a': 5, 'b': 6} [5, 6]
>>>
>>> for row in df.itertuples(index=False):
...   print(dict(row._asdict()))
... 
{'a': 1, 'b': 2}
{'a': 3, 'b': 4}
{'a': 5, 'b': 6}

使用list(row)[1:], 跳过标签,可能适合您。

于 2020-01-06T00:52:35.390 回答