问题标签 [ignore-duplicates]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2258 浏览

sql-server - 忽略索引上的重复值可防止 FOREIGN KEY 约束

由于某些架构原因,我必须忽略索引上的重复值。它工作得很好——除了当我插入错误的数据时。我正在尝试将值插入应该抛出的 FK 列:

INSERT 语句与 FOREIGN KEY 约束“FK__constrainName”冲突。
冲突发生在数据库、表“someTable”、列“FKColumn”中。

是否有忽略重复值的逻辑阻止插入语句抛出此异常?

0 投票
4 回答
19639 浏览

r - 从 R 中的数据框中删除重复的列组合

我想从以下数据中删除 sessionid、qf 和 qn 的重复组合

我将数据作为 data.frame 读入并将其称为 mydata。Heree 是我到目前为止的代码,但我需要知道如何首先正确地对 data.frame 进行排序。其次去掉sessionid、qf、qn的重复组合。最后在 qf 列中的直方图中绘制字符

谢谢!

0 投票
3 回答
741 浏览

mysql - SQL:检测重复客户

我试图创建一个 sql 查询,它将在我的数据库中检测(可能)重复的客户:

我有两张桌子:

  1. 具有以下列的客户:cid、名字、姓氏、zip。请注意, cid 是此表的唯一客户 ID 和主键。
  2. IgnoreForDuplicateCustomer具有以下列:cid1、cid2。两列都是外键,引用了 Customer(cid)。这张表是用来说cid1的客户和cid2的客户是不一样的。

例如,如果我有

  • cid = 1、firstname="foo"、lastname="anonymous" 和 zip="11231" 的客户条目
  • 以及另一个带有 cid=2、firstname="foo"、lastname="anonymous" 和 zip="11231" 的客户条目。

所以我的 sql 查询应该搜索具有相同名字、姓氏和 zip 的客户,并且检测到 cid = 1 的客户与 cid = 2 的客户相同。

但是,通过设置 cid1 = 1 和 cid2 = 2 在 IgnoreForDuplicateCustomer 表中存储一个新条目,应该可以说客户 cid = 1 和 cid=2 不同。

所以检测重复的客户可以很好地使用这个 sql 查询脚本:

我的问题是,我无法将 IgnoreForDuplicateCustomer 表集成到之前的示例中,因为有一个条目/规则,所以 cid = 1 和 cid=2 的客户不会被标记/查询为相同在 IgnoreForDuplicateCustomer 表中。

所以我尝试通过添加 where 子句来扩展我之前的查询:

不幸的是,这个额外的 WHERE 子句对我的结果完全没有影响。有什么建议么?

0 投票
1 回答
1780 浏览

javascript - HTML5 LocalStorage - 检查重复值

我正在使用 LocalStorage 将图像列表(来自画廊)保存到设备中。我已经解决了大部分问题 - 输入和输出数据,并填充其中的项目的 HTML 列表。简单的。

我现在正在尝试签入以查看正在保存的项目,检查数据库中的所有值,并且仅在不重复时才添加它。当我正在构建这个时,我在一个洞里越来越深,并且正处于我需要一些帮助的地步。

这是我目前的功能:

这是一个大混乱,我自己完全糊涂了。谁能帮我弄清楚?

如果需要,我完全不反对重新格式化数据结构。目前键是fav0fav1依此类推。

那里使用的updateFavouritesList()函数只是遍历 localStorage 数据库并<li>从中创建项目以添加到列表中。

0 投票
1 回答
1615 浏览

sql - 从两列进行 SQL 重复数据删除

我已经为此苦苦挣扎了一段时间,但我就是想不通。

我有一个有 3 列的表。2 列包含名称,第三列包含这些名称之间的 Damerau Levensthein 距离 ( http://en.wikipedia.org/wiki/Damerau%E2%80%93Levenshtein_distance )。

每列都包含每个名称,这意味着出现在 autor1 列中的所有名称也出现在 autor2 列中。结果,我需要两倍的行,只是交换了 autor1 和 autor2 列。

例如,第 3 行等于第 1 行,只是交换了自动列,第 2-4 行也是如此。我将如何制定一个省略那些“重复”的查询?
id-|-----auto1----|-----auto2-----| dld
1 -| 阿贝尔,古斯塔夫-| 亚伯,古斯塔夫 | 1
2 -| 阿贝尔,古斯塔夫-| 阿贝尔,古斯塔夫 | 1
3 -| 亚伯,古斯塔夫| 阿贝尔,古斯塔夫 --| 1
4 -| 阿贝尔,古斯塔夫 | 阿贝尔,古斯塔夫-| 1


|-----auto1----|-----auto2-----| dld
| 阿贝尔,古斯塔夫-| 亚伯,古斯塔夫 | 1
| 阿贝尔,古斯塔夫-| 阿贝尔,古斯塔夫 | 1

0 投票
3 回答
1479 浏览

group-by - MySQL选择字段是唯一的还是空的

抱歉,我在任何地方都找不到示例,主要是因为我想不出任何不包括 DISTINCT 或 UNIQUE 的其他方式来解释它(我发现它们在 SQL 中具有误导性)。

我需要从一个表中选择唯一值和空值。

我想要有独特风味(香草、焦糖)的孩子和没有任何风味的孩子。

我不希望孩子有重复的口味(巧克力、草莓)。

我的帮助搜索总是返回有关如何对巧克力和草莓进行 GROUP BY、UNIQUE 和 DISTINCT 的答案。那不是我想要的。我不希望某个领域中有任何重复的术语——我想要其他所有内容。

什么是正确的 MySQL 选择语句?

谢谢!

0 投票
1 回答
1733 浏览

sql-server - 身份插入的 SQL 算术溢出

我在将行 ID 设置为 TINYINT 数据类型的查找表中插入值时出现算术溢出错误。这不是唯一记录数超过 255 个值的情况。这有点不寻常,并且在此设置的第一次测试期间没有发生。

下面代码的生产版本实际上只有 66 个唯一值,但随着时间的推移,可能会添加新值(缓慢且数量非常少)...... 255 个可用插槽对于这个生命周期来说应该绰绰有余分析过程。

我最初的想法是,这可能是由于缓存计划识别分层源表具有超过 255 个值(实际上有 1028 个),并评估这可能超出目标表的容量。然而,我已经测试过这是不正确的。

这似乎不是查询计划缓存问题 - 如果这是真的,我应该会看到方法 1 重新测试的算术错误。

我特别好奇为什么会抛出异常。我可以理解,在方法 1 中测试了所有 100 个唯一值......因此可以想象,查询代理在第二次插入尝试后看到了 200 条记录的潜力;我不明白为什么它会在第三次重复后看到 300 条记录的潜力——第二次尝试导致 0 行,所以最多可能有 200 个唯一值。

有人可以解释一下吗?

0 投票
1 回答
3935 浏览

sql - 从连接查询中只返回一次重复的值

我正在尝试根据人员的工作从我的数据库中的表中提取信息。在一张表中,我有所有客户信息,在另一张表中,通过 ID_no 链接他们的职位和与他们关联的分支机构。我遇到的问题是,当我加入两个表时,我返回了一些重复项,因为一个人可以与多个分支相关联。

我想知道如何只返回一次重复的值,因为我现在只关心人员的 ID 号和他们的职位。

我知道 Select Distinct 在这种情况下不起作用,因为重复的值返回不同的分支。任何帮助,将不胜感激。谢谢

顺便说一句,我正在使用 sql server 2008

*编辑以显示我想要的结果

我希望不显示第二条记录,因为我对分支不感兴趣。我只需要知道员工 ID 和他的职位,但由于表格的结构,它返回 JX100 两次,因为他被记录为在 2 个不同的分支机构工作

0 投票
1 回答
169 浏览

drools - Drools Fusion 重复数据删除

我定义了一个作为规则引擎事件的类

它有以下成员 1. 电话号码 2. 纬度 3. 经度

我如何制定一个规则,其中 1. 该规则计算同一位置的不同人数 2. 如果同一个人在 1 分钟间隔内多次穿过同一位置,则应仅计为一个,不应重复

我制定了以下规则,但它似乎不起作用

有人可以帮忙吗?

问候 Subbu

0 投票
0 回答
287 浏览

sql-server - 如果使用 SQL Server 已经存在,如何忽略插入?

我有一个插入语句,它使用 VALUES 一次插入多行,每组值用逗号分隔,如下所示:

但是,如果其中一个已经存在,则由于 link_instance_message 表上的重复键约束,它无法完成整个操作。我想知道如何让插入语句仍然是一个插入调用但忽略插入让我们说 instance_key = '2222d4a5-6ec6-4a35-a24d-2dc3980b2e29' 因为它已经存在但不忽略实例键 = '2323d4a5-6ec6-4a35 -a24d-2dc3980b6969' 因为它还不存在。

我真的想避免不得不为每个插入进行单独的 SQL 调用,因为最多可以插入 1,000 行,我认为这不是特别有效,但我不确定。