2

假设我有一个 DataFrame 并且不知道所有列的名称。但是,我知道有一个名为的列"N_DOC",我希望它成为 DataFrame 的第一列 - (同时保留所有其他列,无论其顺序如何)。

我怎样才能做到这一点?

4

3 回答 3

3

您可以使用以下命令重新排序 datframe 的列reindex

cols = df.columns.tolist()
cols.remove('N_DOC')
df.reindex(['N_DOC'] + cols, axis=1)
于 2020-03-10T10:56:16.080 回答
1

用于提取列DataFrame.insertDataFrame.pop

df = pd.DataFrame({
        'A':list('abcdef'),
         'B':[4,5,4,5,5,4],
         'C':[7,8,9,4,2,3],
         'N_DOC':[1,3,5,7,1,0],
         'E':[5,3,6,9,2,4],
         'F':list('aaabbb')
})

c = 'N_DOC'
df.insert(0, c, df.pop(c))

或者:

df.insert(0, 'N_DOC', df.pop('N_DOC'))

print (df)
   N_DOC  A  B  C  E  F
0      1  a  4  7  5  a
1      3  b  5  8  3  a
2      5  c  4  9  6  a
3      7  d  5  4  9  b
4      1  e  5  2  2  b
5      0  f  4  3  4  b
于 2020-03-10T11:24:27.760 回答
1

这是一个使用 DataFrame 掩码的简单的单行解决方案:

import pandas as pd

# Building sample dataset.
cols = ['N_DOCa', 'N_DOCb', 'N_DOCc', 'N_DOCd', 'N_DOCe', 'N_DOC']
df = pd.DataFrame(columns=cols)

# Re-order columns.
df = df[['N_DOC'] + df.columns.drop('N_DOC').tolist()]

前:

Index(['N_DOCa', 'N_DOCb', 'N_DOCc', 'N_DOCd', 'N_DOCe', 'N_DOC'], dtype='object')

后:

Index(['N_DOC', 'N_DOCa', 'N_DOCb', 'N_DOCc', 'N_DOCd', 'N_DOCe'], dtype='object')
于 2020-03-10T11:32:09.717 回答