我有一个零售交易数据集,如下所示:
TRANSID GROSS AMNT TRANSROWTYPE
123 50 Z
123 20 A
123 30 A
126 90 Z
126 20 A
126 30 A
126 20 A
… .. .
其中,
• TRANDIS
是交易标识符
• GROSS AMNT
是交易行的总金额
• TRANSROWTYPE
是交易的行类型。
所有交易都有 2 种类型的行
- 类型
A
:交易的详细行。一个事务可以有 1 个或多个 TypeA
行。 - 类型
Z
:交易的标题行。一个事务只能有 1 个类型Z
行。
理想情况下,对于 a ,Type 行中sTRANSID
的总和应该等于 Type 行中的the 。GROSS AMNT
A
GROSS AMNT
Z
在示例中,这对于 是正确的TRANSID=123
,但对于 不是TRANSID=126
。
我的查询是如何将Type rows= s in Type row 中的TRANSIDs
那些与两者不相等的那些分开?
GROSS AMNTs
A
GROSS AMNT
Z
我特别有兴趣找到使用的解决方案dplyr
提前谢谢了。