我有一个大的pandas.DataFrame
(约 250 万行),有 10 列。我需要填充列noshow_label
,我按列对数据进行分组event_label
,如果列event_action
中有一个值no_show
,那么我需要粘贴,True
否则我需要粘贴False
。为此,我使用这种结构:
data['noshow_label'] = data.groupby('event_label')['event_action'].transform(lambda x: 'no_show' in x.values)
当我尝试启动此代码时,它引发了一个错误:
ValueError: Length mismatch: Expected axis has 2328271 elements, new values have 2328273 elements
注意:列
event_action
包含诸如no_show
,show_widget
,之类的值test_passed
。列“事件标签contains labels names like
123123-A”、“123123-B”...
你有什么想法来解决它吗?