4

是否可以创建一个包含浮点数和字符串的列的稀疏 Pandas DataFrame?即,我有一个数据框:

df2 = pd.DataFrame({'A':[0., 1., 2., 0.], 
                    'B': ['a','b','c','d']}, columns=['A','B'])

我想将其转换为稀疏数据帧,但 df2.to_sparse(fill_value=0.) 给出:

ValueError: could not convert string to float: d

有什么办法可以使这项工作?

4

1 回答 1

1

您可以做的是将您的字符串映射到整数/浮点数并将您的列 B 映射到它们的 dict 查找值到新列 C 中,然后像这样创建稀疏数据框:

temp={}
# we want just the unique values here for the dict
for x in enumerate(df2['B'].unique().tolist()):
    val, key = x
    temp[key]=val
temp

Out[106]:
{'a': 0, 'b': 1, 'c': 2, 'd': 3}

# now add this column

In [108]:

df2['C']=df2['B'].map(temp)
df2
Out[108]:
   A  B  C
0  0  a  0
1  1  b  1
2  2  c  2
3  0  d  3

# now pass the two columns to create the sparse matrix:

In [109]:

df2[['A', 'C',]].to_sparse(fill_value=0)
Out[109]:
   A  C
0  0  0
1  1  1
2  2  2
3  0  3
于 2013-10-24T08:50:07.367 回答