这可能是一件非常愚蠢的事情,因为我已经离开 python 10 年了。
我在名为 rebal 的 pandas 数据帧上应用以下函数,该数据帧有几列包含十六进制字符串数据;
def hex2page(s, pagesize=1):
if(s[:2]=='0x'):
i=long(s,16)*pagesize
#print(s, i)
return i
return None
这是一个成功的运行,您可以看到一个新列“分配”,直接转换为十进制(在最右边);
rebal['Allocated']=rebal['Alc_PG'].apply(hex2page)
rebal.head()
Time Stamp LOG POOL Cap T_DEVNum E_DEVNum HDEV Alc_PG T_MVPG E_MVPG 0DPG Hist Allocated
0 2013/08/20 08:51:50 00642fff 0 --- --- --- 0x7c8a --- --- 0x0000d 0x00000 DPV END NaN
1 2013/08/20 08:51:50 00642fff 0 --- --- --- 0x7c8b 0x002e0 0x0008d --- --- DPV START 736
2 2013/08/20 08:51:47 00642ffe 0 --- --- --- 0x7c89 --- --- 0x00018 0x00000 DPV END NaN
3 2013/08/20 08:51:47 00642ffe 0 --- --- --- 0x7c8a 0x002b6 0x0000d --- --- DPV START 694
4 2013/08/20 08:51:40 00642ffd 0 --- --- --- 0x7c89 0x002a0 0x00018 --- --- DPV START 672
所以它适用于 Alc_PG 列。但是,如果我尝试使用相同格式的字符串的另一列,则无法为每个十六进制字符串返回零;
rebal['T_MVPG'].apply(hex2page)
0 NaN
1 0
2 NaN
3 0
4 0
5 NaN
但是,如果我取消注释上述函数中的#print,它会打印正确的转换;
('0x0008d', 141L)
('0x0000d', 13L)
('0x00018', 24L)
('0x00070', 112L)
('0x00073', 115L)
('0x00011', 17L)
('0x00062', 98L)
所以我很困惑。我什至在那里打印了检查类型,并且 s 肯定是作为 str 进入函数的。
有人有什么想法吗?
rebal[0:5].to_dict()
{'0DPG': {0: '0x00000', 1: '---', 2: '0x00000', 3: '---', 4: '---'},
'Alc_PG': {0: '---', 1: '0x002e0', 2: '---', 3: '0x002b6', 4: '0x002a0'},
'Allocated': {0: nan, 1: 736.0, 2: nan, 3: 694.0, 4: 672.0},
'Cap': {0: '---', 1: '---', 2: '---', 3: '---', 4: '---'},
'E_DEVNum': {0: '---', 1: '---', 2: '---', 3: '---', 4: '---'},
'E_MVPG': {0: '0x0000d', 1: '---', 2: '0x00018', 3: '---', 4: '---'},
'HDEV': {0: '0x7c8a', 1: '0x7c8b', 2: '0x7c89', 3: '0x7c8a', 4: '0x7c89'},
'Hist': {0: 'DPV END',
1: 'DPV START',
2: 'DPV END',
3: 'DPV START',
4: 'DPV START'},
'LOG': {0: '00642fff',
1: '00642fff',
2: '00642ffe',
3: '00642ffe',
4: '00642ffd'},
'POOL': {0: 0, 1: 0, 2: 0, 3: 0, 4: 0},
'T_DEVNum': {0: '---', 1: '---', 2: '---', 3: '---', 4: '---'},
'T_MVPG': {0: '---', 1: '0x0008d', 2: '---', 3: '0x0000d', 4: '0x00018'},
'Target': {0: nan, 1: 141.0, 2: nan, 3: 13.0, 4: 24.0},
'Time Stamp': {0: '2013/08/20 08:51:50',
1: '2013/08/20 08:51:50',
2: '2013/08/20 08:51:47',
3: '2013/08/20 08:51:47',
4: '2013/08/20 08:51:40'}}