我想按组识别 py-dtatable 中的重复行(并创建一个带有布尔值的辅助列 C)。
它应该按照以下方式工作:
DT = dt.Frame(A=[1, 2, 1, 2, 2, 1], B=list("XXYYYY"))
我得到 -> TypeError: Expected a Frame,而不是当我对其应用分组以找出组的独特观察时得到类'datatable.expr.expr.Expr'。
但是, unique() 不起作用,关于 py-datatable 可用函数的文档非常稀疏:https ://datatable.readthedocs.io/en/v0.10.1/using-datatable.html#perform-groupby -计算
我不确定 py-datatable 是否落后于 R datatable 并且它不可能,因为它似乎是一个基本操作,但我找不到解决方案。有人有它或可以向我指出资源的方向吗?理想情况下,这将包括在一行代码中的新列 C 中分配布尔(是否重复)的语法。