问题标签 [data-comparison]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1571 浏览

python - 如何跨 SQL Server 和 Postgres 比较表中的数据?

我正在将数据从 SQL Server 2017 迁移到 Postgres 10.5,即所有表、存储过程等。

我想比较一下数据迁移后 SQL Server 和 Postgres 数据库的数据一致性。

我现在能想到的就是使用 Python Pandas 并将表从 SQL Server 和 Postgres 加载到数据帧中并比较数据帧。

但是数据大约是6 GB,这需要很长时间才能将表加载到数据框中,并且还托管在我运行 Python 脚本的本地服务器上。有什么方法可以有效地比较 SQL Server 和 Postgres 之间的数据一致性?

0 投票
1 回答
199 浏览

r - 如何检查我的表是否符合另一个表中的条件

我是 R 的新手。这个问题似乎很常见,但我无法从以前的问题中找到相关答案。

我有如下数据:

在此处输入图像描述

并将我的最大限制如下表(每行是一个单独的标准)。 在此处输入图像描述

我想对我的数据中符合这些条件的所有行进行比较,并希望将黄色列作为返回结果。

在此处输入图像描述

希望这很清楚。

0 投票
0 回答
203 浏览

visual-studio - 忽略 Visual Studio SQL 架构比较中的依赖项

是否可以忽略 Visual Studio SQL 架构比较中依赖项的自动选择?

它弊大于利 - 如果我想选择具有依赖关系的存储过程的更改,它会自动选择依赖关系,即使差异只是不同地设置特定于环境的变量。我在窗户里看不到它settings,但我可能只是瞎了。

0 投票
2 回答
60 浏览

unix - 有没有办法将文件与表记录与使用 Informatica 创建新映射进行比较?

我正在处理一个场景,在将数据文件加载到临时表之前,我必须将来自文件的数据记录与来自表的数据进行比较,作为验证检查的一部分。我提出了几个可能的场景,其中涉及需要在负载映射中更改的内容,但我的团队建议我对易于注意到的内容进行更改,因为它是一种非标准方法。

是否有任何方法可以使用任何工作流任务或会话属性在工作流管理器中处理?

0 投票
1 回答
81 浏览

r - 你知道为什么在尝试 pairw.anova 时 dims [product 0] 与 object [1] 的长度不匹配吗

我有这个数据:

a是具有 3 个级别 12、14 和 16 的因子,并且b是我的响应变量

当我尝试跑步和绘图时pairs.anova

我收到此错误:

暗淡 [产品 0] 与对象 [1] 的长度不匹配

你知道为什么吗?

谢谢你的帮助。

0 投票
1 回答
75 浏览

oracle - 比较两个oracle数据库表和它的值以有效的方式

两个 oracle 数据库,例如DatabaseADatabaseB. 两者都是镜像数据库。每个数据库有 20 个表。 DatabaseA指向旧方法 Spring batch,它与生产相同。Spring Batch 针对设计问题进行了修改。新的 Spring 批处理应用程序指向DatabaseB.

如果我在两种 spring 批处理方法中运行相同的文件,则两个数据库在表中应该有相同的条目。

我需要比较两种方法中的所有表值是否相同。

有什么方法可以比较吗?有什么工具可以实现这一点。?

0 投票
1 回答
950 浏览

java - 比较 csv 文件和 MySQL 数据库

我正在用 Java 创建一个程序,我需要比较 csv 文件中的数据是否与 mysql 表中存在的数据完全相同?我怎样才能做到这一点?例如,我有一个表“供应商”,其中包含“ID、名称和地址”列。谢谢

下面是我读取 csv 文件并连接到数据库并在表中显示数据的代码。

0 投票
0 回答
42 浏览

python - Python 中的 Datacompy 库在报告中将阿拉伯字母写成乱码

我在 Python 中使用 Datacompy 库来比较两个具有阿拉伯数据的数据帧,数据使用“cp1256”编码器安全且成功地编码,Python 在控制台上正确显示阿拉伯字母,但是当 Datacompy 开始比较数据然后产生比较时报告中,阿拉伯字母在 Report.txt 文件中被转换为 ÃáÚ 和 ÃÃ'åÔæÈ 之类的东西。

我可以解决这个在文件中以错误方式书写阿拉伯字母的问题吗?任何帮助,将不胜感激。谢谢

0 投票
2 回答
98 浏览

r - 使用向量化将矩阵与 R 中的向量进行逐行比较

我想将矩阵的每一行与向量进行比较,并从第i行生成第一个值的索引,该索引小于向量中的第i个值。矩阵的每一行中的值按降序排序。由于行数非常大,我正在寻找一个矢量化的解决方案,并希望避免循环并应用函数。

比如我想比较下面的矩阵M和向量v,那么输出应该是(3,2,3,NA)。

当我在 R 中使用 'which' 函数时,它适用于每一行但不是矢量化的。

谢谢!

0 投票
1 回答
53 浏览

c# - SQL 过程错误地检查值是否存在

我正在构建一个连接到 SQL 数据库的 Windows 窗体应用程序。在我的应用程序启动时,它会向数据库发送一些查询以比较值:

查询列表

这是生成查询的代码:

queries是一个公共列表。

这是将查询发送到数据库的代码:

在我的 SQL 数据库中,我创建了一个在数据库接收到查询时调用的存储过程:

当我在一个空数据库上运行我的应用程序时,这些值将毫无问题地添加:

数据库的表:第一次启动.

我也没有出现任何错误。只有当我第二次启动我的应用程序时,前两个查询才不会在 IF EXISTS 上得到检查。因为它仍在将数据插入我的数据库,准确地说是 5 倍。

充满重复的数据库.

这很奇怪,因为只有 2 个查询包含数据,但每次都会执行。