1

我的数据框如下:

name  |  salary 
Tom   |   10200 
Kate  |          
Mi    |   32311 

kate 的值是''关于薪水和round_salary,我用''替换它的值,所以它在单元格中什么都不显示。

问题:

我想根据将薪水四舍五入到最接近的 10,000 创建一个新的薪水列。

结果如下所示

name  |  salary | round_salary
Tom   |   10200 |  10000
Kate  |         |  
Mi    |   32311 |  30000

我的代码如下所示:

def round_income(salary):
    if '' in salary:
        return ''
    else: 
        return salary.round(decimals = -4)

income.apply(lambda x: round_salary(x['income']), axis=1)

输出错误是:

KeyError: ('salary', 'occurred at index 0')

谁知道怎么修它?我发现 map 或 apply 函数可以解决它,提前感谢任何人的帮助。~

4

1 回答 1

1

如果没有缺失值但非数字为空值的解决方案:

income['salary'] = (pd.to_numeric(income['salary'], errors='coerce')
                      .round(decimals = -4)
                      .fillna(''))
print (income)
   name salary
0   Tom  10000
1  Kate       
2    Mi  20000

缺少值的解决方案 - 列中的所有数据salary都是数字:

income['salary'] = income['salary'].round(decimals = -4).astype('Int64')
print (income)
   name  salary
0   Tom   10000
1  Kate     NaN
2    Mi   20000
于 2019-12-09T12:09:56.407 回答