问题标签 [database-reconciliation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
641 浏览

testing - 在 AWS 云 (RedShift) 上测试数据库?

我们已经从 IBM DB2 数据库转向在 AWS 云上拥有 PostGRE SQL 数据库。是否有人知道或曾与 AWS 合作测试数据库?

除了负载或性能测试之外的任何东西。我希望检查功能测试,在那里我验证/验证云服务器和数据库上的数据是否等同于使用 DB2 作为数据库的物理服务器中的数据。

所以,主要是一种数据核对,但也涉及到ETL。

0 投票
1 回答
4739 浏览

database - 用于跨两个表验证/协调数据的 SQL,当每个表都是另一个表的副本时

我正在寻找跨 2 个表验证数据,其中 TableA(在用户源数据库 - DB2 中)是 TableB(在数据仓库 - DB2/Netezza 中)的副本。

由于复制数据的过程不稳定并且每天都在运行而不是实时运行,因此目标数据库中存在差异,我需要找出并找到。此外,不希望在服务器上增加很大的负载,这可能会破坏组织的正常运营。

我目前正在执行以下操作:

除了上述之外,还有没有其他更简单的方法可以在单个 SQL 查询中完成,不会占用数据库服务器上的太多资源?

另外,有没有人知道一种方法来匹配 DB2-DB2 和 DB2-Netezza 表中的行与行,就像使用 SAS 表一样?

笔记:

0 投票
2 回答
105 浏览

mysql - Mysql:从元素中设置一些值

在我的数据库中,我有一些具有多个 Id 的值和一个我与之调和的 Id,例如:

编号:234 | Viaf_id: 3475903 | 姓名:阿图罗·罗西 | 名字:罗西 | 姓名:阿图罗

编号:345 | Viaf_id: 3475903 | 姓名:罗西,阿图罗 | 名字:阿图罗 | 姓名:罗西

我想viaf_id用名称为 345 的 3475903 设置所有这些值。现在我“手动”使用:

但这需要我很多次,有没有办法将值“Name”、“FirstName”和“LastName”设置为具有特定 id_creator 的值id_viaf

0 投票
1 回答
583 浏览

groovy - 通过groovy执行sql

尝试使用查询插入一行。

如何通过插入 sql 查询使用 groovy 对目标系统进行协调?

错误:

java.sql.SQLException:在 grov.main(grov.groovy:25) 找不到适合 jdbc:oracle:thin:@localhost:1521:orcl(sid) 的驱动程序

0 投票
1 回答
637 浏览

sql - 对账自动化查询

我有一个数据库,有时我会根据要求更改查询的某些部分。我想在一张表中记录这些查询结果之前和之后的结果,并希望显示产生差异的查询。

例如,考虑下表

现在,我之前的查询是:

查询前:

结果之前:

查询后:

查询结果后:

我想要的最终结果或表格是:

......但如果查询结果与此表中不应显示的结果相同。

提前致谢。

0 投票
1 回答
85 浏览

powershell - 使用 Windows PowerShell 进行贸易对账

我希望使用 PowerShell 快速协调大量交易估值。

例子:

我的问题是如何Trade_id在文本文件中显示估值的差异?

我在想这样的事情-

但是,结果的格式并不是我想要的。我希望命令通过Trade_id不管Trade_ids 在每个文件中的位置来评估差异并提供差异。

0 投票
1 回答
104 浏览

oracle - 比较 2 个不同数据库中的 2 个表中的数据

我有一个 oracle 数据库和一个 postgresql 数据库。两者都有一组具有完全相同定义的表。我想持续比较这两个表中的数据。是否有任何 AWS 服务或开源工具可用于进行此比较?

0 投票
1 回答
21 浏览

excel - 在 Excel 中获取“最新”版本的客户信息

我有三个客户数据电子表格(姓名、电子邮件、实际地址)。这些工作表每个都有一个日期列,表示上次更新联系人的时间。我需要使用每个人的最新联系信息从三个人中创建一个电子表格。“关键”(我用来确定两个联系人是否相同)是电子邮件,但是这三张表的客户并不相同。电子邮件地址可能存在于一张、两张或所有三张工作表中。无论它存在什么,我都需要最新版本。

0 投票
3 回答
1201 浏览

excel - Conditional formatting, search formula

For reference, I have two data sets, one that with scraped names and one with manually input names. The Manual input set has broader coverage but the scraped set is more accurate.

So I have used textjoinif to create a list of the manually input towns for each company, I have the scraped towns each in its own cell in the same row. I want to have conditional formatting where each of the scraped values will be searched in the textjoin string associated with the same ID (same row), and highlighted green if there is a match.

It's entirely possible I'm making this more difficult than it needs to be, but this is being used for several thousand IDs and many thousand contacts

Here is the example I was using

enter image description here

0 投票
1 回答
86 浏览

openrefine - Openrefine - 由第二个或第三个候选人协调

使用协调服务时,我经常遇到这个问题:最好的候选人并不是真正正确的,最好的是第二或第三候选人(广告它也有更好的分数),像这样:

第三个候选人是正确的

如何批量选择正确的?我有数千条记录,我偶然发现了很多这样的案例。我觉得应该是某种方式,不是一一做的。

例如,上面写着“无论其位置如何,都获得最佳候选人分数”。

编辑:正如pintoch所说,这可能是一个错误。与此同时,可以创建两个数字方面。一个与cell.recon.candidates[1].score另一个与cell.recon.candidates[2].score。与他们一起玩可以选择第三名和第二名候选人的分数,以确保您获得最高分数的候选人。然后就得一一调和,不过只是点击的问题。