0

我有 Challenge TalkingData AdTracking Fraud Detection 的数据集,需要检查在多列中重复或重复的总值(行)。我尝试cbind(lapply(lapply(df1, duplicated), sum))了,但这段代码验证了每列中的重复值。我需要在所有列或选定的列中重复的检查值。

我知道 python 中的这段代码是sum(df1.duplicated(subset = list(df1.columns))),但在 RI 中不知道。

cbind(lapply(lapply(df1, duplicated), sum))
# Dados duplicados
ip              184626494
app             184903184
device          184900415
os              184903090
channel         184903688
click_time      184644270
attributed_time 184721832
is_attributed   184903888
4

0 回答 0