1

我有一个包含单列数据的文件。其中很少需要转换为列作为标题。经过几次 dask 计算后,我将数据框减少如下:

In [9]: df.compute()
Out[9]:
                                    *
0                    140 Global Intel
1                         1 Frequency
2                          2 Currency
3               3 Currency Conversion
4                            4 Market
5                      5 Segmentation
6                            6 Sector

是否可以将行转换为列并使用 dask 本身创建一个新的数据框?任何帮助表示赞赏。

编辑:这是我的最终数据框在转置后应该是什么样子的。

In [22]: df_final
Out[22]:
Empty DataFrame
Columns: [140 Global Intel, 1 Frequency, 2 Currency, 3 Currency Conversion, 4 Market, 5 Segmentation, 6 Sector]
Index: []
4

1 回答 1

1

column='*'您可以使用以下方法从DataFrame df 的列(在您的情况下为 : )创建一个空的 DataFrame :

import pandas as pd
df_empty = pd.DataFrame(columns=df.compute()[[column]].T)

如果您打印df_empty

Empty DataFrame
Columns: [(140 Global Intel, 1 Frequency, 2 Currency, 3 Currency Conversion, 4 Market, 5 Segmentation, 6 Sector)]
Index: [] 

如果要切换回 Dask,请使用dd.from_pandas

于 2020-01-28T10:02:42.970 回答