我正在使用read_csv()
pandas 的出色功能,它提供:
In [31]: data = pandas.read_csv("lala.csv", delimiter=",")
In [32]: data
Out[32]:
<class 'pandas.core.frame.DataFrame'>
Int64Index: 12083 entries, 0 to 12082
Columns: 569 entries, REGIONC to SCALEKER
dtypes: float64(51), int64(518)
但是当我应用 scikit-learn 中的函数时,我会丢失有关列的信息:
from sklearn import preprocessing
preprocessing.scale(data)
给出 numpy 数组。
有没有办法将 scikit 或 numpy 函数应用于 DataFrames 而不会丢失信息?