我最近开始将我的数据探索代码集pandas
从blaze
. 我遇到了以下问题。
认为:
from blaze import *
s = Data([(1, 'Alice', 100),
... (2, 'Bob', -200),
... (3, 'Charlie', 300),
... (4, 'Denis', 400),
... (5, 'Edith', -500)],
... fields=['id', 'name', 'balance'])
我们可以pandas.DataFrame
通过into
容易地计算出类似的东西:
into(pd.DataFrame,s).balance.apply(abs)
但是,我在尝试这样做时遇到了严重的困难:
s.balance.map(abs,schema='{b: int64}')
抛出一个TypeError: a bytes-like object is required, not 'int'
除其他外。
这个问题似乎与将函数应用于列或通过将函数应用于另一个列来创建新列的最佳方法有关?这是关闭的,所以我不知道去哪里。
ps:如果您觉得这很琐碎并想将问题标记下来,还请提供完整的工作答案。