2

我正在Series通过该Series#append方法向熊猫添加数据。不幸的是,当nan添加到bool系列时,它会自动转换为float系列。有什么办法可以避免这种转换,或者至少将其强制转换为objectdtype,以保持bools 和floats 之间的区别?

>>> Series([True])                            
0    True
dtype: bool
>>> Series([True]).append(Series([np.nan]))
0     1
0   NaN
dtype: float64
4

1 回答 1

1

正如@Jeff 所说,最好的方法是附加一个Serieswithobject dtype

这是一个使用示例Series

s = Series([True])
s.append(Series([nan], index=[1], dtype=object))

屈服

0    True
1     NaN
dtype: object

还有一个DataFrame

df = DataFrame({'a': rand(10) > 0.5, 'b': randn(10)}, columns=list('ab'))
df2 = DataFrame({'a': Series([nan], dtype=object), 'b': [1.0]}, columns=df.columns, index=[len(df)])
df3 = df.append(df2)
print df3
print
print df3.dtypes

这使

        a      b
0   False -0.865
1    True -0.186
2    True  0.078
3    True  0.995
4   False -1.420
5    True -0.340
6    True  0.042
7    True -0.627
8    True -0.217
9    True  1.226
10    NaN  1.000

a     object
b    float64
dtype: object

它看起来有点笨拙,但如果你已经有了,Series那么你可以在附加之前s.astype(object)将它们转换为。object dtype

于 2013-08-21T00:52:27.610 回答