问题标签 [data-linking]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1667 浏览

r - RecordLinkage:如何仅配对最佳匹配并导出合并表?

我正在尝试使用 R 包RecordLinkage将采购订单列表中的项目与主目录中的条目进行匹配。下面是 R 代码和使用两个虚拟数据集(DOders 和 Dcatalogue)的可重现示例:

出于实验的目的,DOrders 有 7 个条目,每个条目都与参考集 Dcatalogue 中的九行之一匹配。在真实数据中,并非所有订单都会匹配。

链接的第一步是确保项目按发行单位 (UOI) 匹配。这是因为一包物品显然与一个单位不一样,即使物品完全相同。例如:

是相同的项目,但不应匹配:

因此,我使用了阻塞参数blockfld = 3来尝试仅匹配第三列中具有相同值的那些条目。此外,使用exclude = 4, 从匹配中排除价格。这将在 Orders 和 Catalog 之间有所不同,这本身就是匹配的主要兴趣所在。匹配是在产品和供应商名称上使用jarowinkler字符串比较器(如此处所述)完成的:

接下来,我正在使用 Contiero 等人计算每对的权重。(2005)方法:

基于此分布,我想仅将那些权重 > 0.7 的对分类为匹配

这是据我所知,但有一些问题。

首先,getPairs(result)表明来自 DOders 的一个条目可以与 Dcatalogue 中的多个条目具有高权重匹配。例如

这对匹配正确,权重为 0.948

但也与权重 0.928 不正确匹配:

显然,我需要将配对限制为只有一个权重最高的最佳匹配,但该怎么做呢?

最后,我正在寻找的最终结果是一个合并的数据集,其中包含一行中来自 Orders 和 Catalog 的匹配条目,两个原始集合中的所有列并排进行比较。getPairs以尴尬的格式产生输出:

0 投票
0 回答
68 浏览

r - RLBigDataLinkage 中的 fsWeights R 中

我们在 R 中使用 RLBiggDataLinkage 来链接两条记录 1. 主数据(约 160 万条记录) 2. 目标(约 10 万条记录)

列是名字、姓氏、地址、邮编、唯一 ID1、唯一 ID 2

两个数据集中的所有记录都没有唯一 ID。尽管在可用的情况下,它们应该被给予最高的重视。

我们使用 fsWeights 来提供 m 和 u 概率和截止值,以便为匹配模式提供固定权重

compare_fs <- fsWeights(compare_lm, m = c(0.99,0.99,0.8,0.6,0.9,0.6,0.99,0.99,0.85), u = c(0.000001,0.000008,0.00003,0.00003,0.8,0.009,0.010001,0.0000 0.000003), 截止 = c(1,0.95,0.95,0.9,1,0.98,0.99,0.99,1) )

我们在所有列上使用字符串比较并阻止名字的前 3 个字符(这样做是为了避免错过名字中有拼写错误的对)

compare_lm <- RLBigDataLinkage(master_lm, target_lm, blockfld = c("FIRST_NAME_3"),strcmp = c("FIRST_NAME", "LAST_NAME", "ADDRESS1","ZIP_OR_POSTAL_CODE", "UNIQUEID_1","UNIQUEID_2"), strcmpfun = " jarowinkler", exclude=c("ID") )

我们的匹配条件是,当两个记录对中都有 id 时,那么至少 1 个 id 应该匹配,否则

名字,姓氏,地址应该匹配。

使用 fsweights,我们得到相似对的不同权重,例如 pair 1 : weight 27.33 。名字、姓氏、地址匹配。主数据中的标识符为空。正确匹配

AMMANARIA ASSEVERO 71RATHERAVESTE130STE130 12534 NA
AMMANARIA ASSEVERO 71RATHERAVE 12534 AASSEVERO@CMH-NET.ORG 761669 523783006

第 2 对:重量 27.33。只有名字,姓氏匹配。地址和标识符不匹配错误匹配

约翰苏克 1532SULTANAVE 70112 护士jd@cox.net 67541 740753012 约翰苏克 201LYONSAVE 7112 SRSOOKE314@GMAIL.COM 9110520 350169181

第 3 对:重量 42 。名字、姓氏、地址匹配。主数据中的标识符为空。

博尔赫斯TENCIA 2608ERESIDENTIALBLVD 33344 NA
博尔赫斯TENCIA 2608ERESIDENTIALBLVD 33344 BORGES.TENCIA@HOLY-CROSS.COM 1519647 3008480850

第 1 对和第 3 对应获得与给定 m、u 和切断相同的重量

我们如何增加第 1 对的权重或减少第 2 对的权重以确保我们有所有正确的匹配。

0 投票
4 回答
7754 浏览

google-apps-script - 谷歌幻灯片自动更新链接/从谷歌表链接的表格

我有一个 Google 幻灯片演示文稿,其中有一些链接到 Google 表格中的数据的单元格/表格。目前,我必须手动单击每个链接的单元格/表格来更新值。我需要一个用于自动更新/批量更新/刷新这些链接的 Google 幻灯片脚本,以便值/表格自动更新。那可能吗?

0 投票
0 回答
126 浏览

sql - 如何将 db2 表列链接到另一个对象?

我是新手DB2,我正在使用一个IBM i series系统。我有一个带有特殊列“ X”的对象。只要满足某些条件,我就想将数据存储X在另一个对象中,并且我可以从原始对象中获取特殊记录(哪些数据已存储在另一个对象中)和普通数据(哪些值存储在原始对象中)的数据。

如何将此列链接到另一个对象?可以DB2 data linkdata-link在这种情况下帮助我吗?如果是,我该如何实施?我找不到有关如何执行此操作的完整教程。我将不胜感激。

0 投票
1 回答
663 浏览

excel - 使用 VBA 在 AutoCAD 中更新表数据链接

我有一个问题,有一个包含大量数据链接的 AutoCAD 文件,并且只想更新与特定表相关的数据链接。类似于选择带有数据链接的表的功能,右键单击并选择更新表数据链接。

我有以下代码:

它可以工作,但会更新绘图中的所有数据链接(这是一个问题),因此一个完美的解决方案可以让我获取关联的链接tblRef
并将行更改为:
ThisDrawing.SendCommand "DATALINKUPDATE" & vbCr & "U" & vbCr & "D" & vbCr & "datalink_name_from_tblRef" & vbCr

或者直接发送命令更新链接到tblRef

0 投票
1 回答
333 浏览

excel - 需要更改 AutoCAD 数据链接指向的 excel 命名范围

我有大量类似的 DWG 文件,每个文件都有一个通过数据链接链接到 excel 的表格。这些表在每个文件中都会随着时间的推移而变化。

我想要做的是转到每个 DWG 文件并更改数据链接,使其指向 excel 中的适当命名范围。

到目前为止,除了更改数据链接指向的位置外,我已经成功完成了所有工作

请注意,发送命令不起作用,因为无法从命令行控制数据链路

这是 autocad 论坛中的一篇文章,它提供了一些启示,但我不知道在哪里可以找到或如何使用 cao 库 https://forums.autodesk.com/t5/visual-basic-customization/repath-the-excel -参考通过-vba/td-p/5432417

理想的结果会改变数据链接指向的位置

更新:这让你循环遍历所有字典,直到你到达通过 CAO 库访问的数据链路字典。然后循环通过所有数据链路(我又卡住了)

据我所知,它通过活动 dwg(我可以处理)

0 投票
0 回答
38 浏览

oracle - Oracle 中的索引和数据链接

我有这个查询,它使用数据链接更新 Oracle 模式中的值,以从另一个模式中存在的表中检索值。

TABLE1.ID 是主键。TABLE2.ID 是主键。

我的问题:这个查询在通过数据链接时会使用 TABLE2.ID 上的索引吗?如果是这样,是否需要启用数据链路上的任何内容才能使索引可用?

我得到的解释计划对我没有多大帮助。

我期待对 TABLE1 进行全表扫描,因为我正在更新整个表。但是我如何解释解释计划的第 3 行?对于 TABLE1 中更新的每一行,是否对 TABLE2 进行全表扫描?

0 投票
1 回答
44 浏览

javascript - Javascript:访问数据链接属性

https://151megapixel.co.nz/concrete5/index.php/gallery

我有一个使用 SmartPhoto 生成的 javascript 幻灯片(所以我可以获得缩放功能)。但是,我希望将数据标题作为指向另一个页面的链接。我不能在这里发布 javascript 代码,因为它超过 1000 行。

我试过了:

0 投票
0 回答
338 浏览

apache-spark - 如何根据多个排名条件合并到 Delta Lake?

我有一个用例,我需要根据 9 个不同的排名条件将三角湖中的青铜表合并到三角湖中的银表。条件根据业务优先级进行排序。当记录没有合并到最高优先级规则中时,它应该沿着列表向下并尝试在下一个规则中合并,直到尝试所有 9 条规则。任何与这 9 条规则中的标准不匹配的内容都应分配内部 id 并添加到银表中

例如:

  1. 如果青铜表中的记录有 my_company_id 将其与 my_company_id 上的白银表合并
  2. 如果青铜表中的记录没有在规则一中合并,请尝试在 some_external_id、first_name、last_name 上合并它
  3. 如果青铜表中的记录没有在规则一和规则二中合并,则尝试在 ssn、first_name、last_name、zip_code .... 上合并它,直到规则 9

任何不匹配的我都应该分配它 my_company_id

基本上,银表应该有最新的记录,并且每条记录都应该有内部的 my_company_id,无论它已经存在还是新记录。

我正在使用火花流和 foreachBatch 方法,但我不确定通过所有规则的最佳方法是什么。其中一种方法可能是根据我需要用于不同规则的字段过滤不同组中的微批次

但问题是如果 rule1_candidates 出于某种原因与 my_identifier 不匹配,我仍然必须将其传递给优先级较低的规则,因此我必须在合并后实现逻辑以找出未合并的内容。只是把所有的东西都缝合在了复杂的地方,这似乎不是一个正确的方法。有没有更好的方法来做到这一点?

0 投票
0 回答
26 浏览

netsuite - N/datasetLink with Dataset Builder Plug-In:链接集合后如何显示数据?

下面的代码示例... 创建我的linkedDataset 后如何显示它?我知道它必须对 context.dataset 做一些事情,但我无法让它工作。我错过了一些东西......有什么想法吗?

var salesRebatesData = datasetLib.load({ id: 'custdataset30' });

var rebatePlansData = datasetLib.load({ id: 'custdataset29' });

var srGroupCode = salesRebatesData.getExpressionFromColumn({ alias: 'entitycustomercustentity_pls_uk_customer_group_codename' });

var rpGroupName = rebatePlansData.getExpressionFromColumn({ alias: 'custrecord_pls_cust_grpname' });

var myDatasetLink = datasetLinkLib.create({