我有一个零售交易数据集,如下所示:
TRANSID GROSS AMNT TRANSROWTYPE
123 50 Z
123 20 A
123 30 A
126 90 Z
126 20 A
126 30 A
126 20 A
… .. .
其中,
• TRANDIS是交易标识符
• GROSS AMNT是交易行的总金额
• TRANSROWTYPE是交易的行类型。
所有交易都有 2 种类型的行
- 类型
A:交易的详细行。一个事务可以有 1 个或多个 TypeA行。 - 类型
Z:交易的标题行。一个事务只能有 1 个类型Z行。
理想情况下,对于 a ,Type 行中sTRANSID的总和应该等于 Type 行中的the 。GROSS AMNTAGROSS AMNTZ
在示例中,这对于 是正确的TRANSID=123,但对于 不是TRANSID=126。
我的查询是如何将Type rows= s in Type row 中的TRANSIDs那些与两者不相等的那些分开?
GROSS AMNTsAGROSS AMNTZ
我特别有兴趣找到使用的解决方案dplyr
提前谢谢了。