我有 Challenge TalkingData AdTracking Fraud Detection 的数据集,需要检查在多列中重复或重复的总值(行)。我尝试cbind(lapply(lapply(df1, duplicated), sum))
了,但这段代码验证了每列中的重复值。我需要在所有列或选定的列中重复的检查值。
我知道 python 中的这段代码是sum(df1.duplicated(subset = list(df1.columns)))
,但在 RI 中不知道。
cbind(lapply(lapply(df1, duplicated), sum))
# Dados duplicados
ip 184626494
app 184903184
device 184900415
os 184903090
channel 184903688
click_time 184644270
attributed_time 184721832
is_attributed 184903888