问题标签 [anti-join]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
14 浏览

mysql - MySQL 省略了用户在检查“已看到”表时已经看到的行

我试图弄清楚如何最好地编写一个省略maintable用户(uuid_user)已经看到(seentable)的返回行()的语句。

  • 问:我应该让“seen”表成为每个用户的单独表吗?

目前,我将它作为所有用户的单个seen

用户已经看到的行存储在seentable每个uuid_user. 这是我的表格的简化版本。uuid用作加入的密钥。uuid_user标识特定用户看到的行。

不太工作:

0 投票
0 回答
19 浏览

r - R中两个大数据框之间的不常见行

嗨,我有两个数据框,它们共享大部分常见的行,但我仍然想在一个列中找到一些行,而另一列中不存在

第一个数据框就像

群组 ID 性别

印度 fam30 1

德国 fam80 2

法国 fam33 1

印度 fam65 1

德国 fam23 2

另一个数据帧有一些在前一个数据帧中不存在的值。

群组 ID 性别

印度 fam30 1

德国 fam80 2

法国 fam33 1

印度 fam65 1

德国 fam23 2

德国 fam67 1

印度 fam16 1

我想找到第二个数据框具有的额外行。我试过反加入

问候

0 投票
1 回答
35 浏览

r - 仅当整行相似时如何反加入

我有两个数据。框架,一个包含从内部系统导出的所有事务 (fullDF),另一个包含已审查的事务 (reviewDF)。两个 DF 包含相同的格式、列标题,并且源自相同的内部系统。列由 orig_name、orig_id、orig_fi、orig_address、bene_name、bene_id、bene_fi、bene_address、金额和日期组成。

我正在尝试 anti_join 在两个 DF 中找到的重复交易,以删除已经审查过的交易;但是,anti_join 不能基于单列标准。我的目标是仅当一行中的所有列值都相似时才反加入所有重复项。

我尝试了以下方法:

尽管我指定了所有列名,但似乎 r 仍在根据条件之一删除事务;例如:如果 bene_name 是重复的,它将删除所有具有相似 bene_name 的行,即使并非所有具有所述 bene_name 的事务都已被查看。更具体地说,即使其他字段(例如日期或金额)不同,包含相似 bene_name 的行也会被删除。

有一个更好的方法吗?

谢谢大家的帮助!

0 投票
2 回答
446 浏览

apache-spark - 在连接中广播左表

这是我的加入:

看来我只能广播正确的数据帧。但是为了让我的逻辑起作用(leftanti join),我必须df_small在左侧。

如何广播左侧的数据帧?


例子:

0 投票
1 回答
56 浏览

r - 如何使用具有不同级别的两个变量的anti_join?

我已经尝试了几个小时,但我无法弄清楚。我有一个包含主题和条件的数据框df1,我想从中排除具有特定值的观察值(变量“值”中小于 3)df2。我无法使其工作,因为我需要从df1不同级别的组合中删除的两个变量。

这是df1:

这是df2

我想删除df1所有主题和条件的组合,其值低于 3,所以这将是最终的 df:

到目前为止,我一直在这样做,但我不能再这样做了,因为我有数百行......

0 投票
1 回答
54 浏览

python - python中的SQL查询等效于:仅删除数据框中的一条相同记录

问题stmt: 根据来自不同表[INC]的条件[OP_DIRECTIVE = 'D']从表[MDF]中删除列。两个表都有相同的列。

我正在寻找 Python 中的 SQL 等效查询来删除一条相同的记录,即使有多个记录与DELETE条件匹配

我在 SQL [working] 中写过相同的内容:- 解决方案的方法:将不匹配的行复制到工作表,然后截断原始表并替换为工作表的内容。识别不匹配行的一种方法是使用唯一编号标记一组重复项中的每个输入行,如下所示:

我试过的:

但这会删除所有匹配“D”作为指标的记录,显然我在ROW_NUMBER这里丢失了,所以我想知道如何在 python 中实现它

MDF-以前

INC

MDF-after-updates-expected output

0 投票
3 回答
107 浏览

r - R anti_join 只保留一个数据帧中的行

有没有一种简单的方法来制作 anti_join 的结果,以便结果中只存在 df1 的行。因此,例如,ID 为 7 的行被丢弃在结果数据框中。我只能想到费力的解决方案。提前致谢。

结果表应如下所示:

结果

0 投票
3 回答
46 浏览

node.js - mongodb - 有条件的左连接

我正在尝试对这两个集合进行左反连接。

我希望所有部门等于“IT”的用户不在结束时间 > 175 的会议中。无论是作为创建者还是接收者。所以基本上谁在最后 xxx 时间没有参加过会议。

基于以下集合: John 将被检索,因为他是 IT 部门的一部分,并且在“175”之后没有成为接收者或创建者。简在 175 之后有一个结束时间并且在 IT 部门,所以不会被检索到比尔是财务部门的一员,所以即使他没有去过也没关系 Bob 有一个结束时间在 175 之后的时间并且在 IT 部门,所以不会被找回 Mary 在 IT 部门,并且没有参加任何会议,所以她被找回了。

用户收藏:

会议收藏:

输出:

我的做法:

0 投票
1 回答
326 浏览

join - 根据自身的过滤版本加入数据框

我有两个数据框,left并且right. 后者 ,right是 , 的子集leftleft包含所有行right。我想通过做一个简单的“left_anti”连接right来删除多余的行。left

left我发现如果我使用右侧的过滤版本,则连接不起作用。只有当我从头开始重建正确的数据帧时,它才有效。

  • 这里发生了什么?
  • 是否有不涉及重新创建正确数据框的解决方法?
0 投票
3 回答
52 浏览

r - 如果条件连接不执行,如何从其他列添加值?

我有两张桌子,这张是旧名字

新名称

基本上我想加入第一个表(旧名称),如果有名称更改,它将显示新的姓氏,否则为空白

请注意,迈克尔和斯科蒂的名字没有改变,因此在差异中有一个空白。