1

我正在使用来自 kaggle 的这个数据集

有一栏显示哪些受访者发表了评论,哪些受访者没有发表评论。未发表评论的受访者具有 NaN 值。我想创建另一个变量,如果有人发表评论,则显示 1,如果有人没有发表评论,则显示 0。这是我使用的代码:

for i in df['comments']:
    if i==np.nan:
        return 0
    elif i!=np.nan:
        return 1

但是,我收到以下错误:

return外功能。

任何帮助将非常感激。

4

1 回答 1

1

试试这个对你有帮助!!!

import numpy as np

def fun():
    m = 0 if i is np.nan else 1
    return m

for i in data["comments"]:
    new = fun()
    print(new)
于 2019-09-23T16:28:29.703 回答