我正在使用来自 kaggle 的这个数据集。
有一栏显示哪些受访者发表了评论,哪些受访者没有发表评论。未发表评论的受访者具有 NaN 值。我想创建另一个变量,如果有人发表评论,则显示 1,如果有人没有发表评论,则显示 0。这是我使用的代码:
for i in df['comments']:
if i==np.nan:
return 0
elif i!=np.nan:
return 1
但是,我收到以下错误:
return
外功能。
任何帮助将非常感激。