问题标签 [data-mapping]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-3.x - 如何验证熊猫中 2 个数据帧之间的数据映射
我正在尝试验证特定列的两个数据框之间的数据映射。我需要验证以下内容:
- 如果 df1 中特定列中的值与 df2 中特定列中的映射匹配。
- 如果 df1 中特定列中的值与 df2 中特定列中的指定映射不匹配 - df2 中的不同值。
- 如果 df1 中特定列中的值在 df2 中没有匹配项。
df1 看起来像这样:
cp_id | cp_code |
---|---|
2A23 | 一个 |
2A24 | D |
3A45 | G |
7A96 | 乙 |
2A30 | R |
6A18 | ķ |
df2 看起来像:
cp_type_id | cp_type_code |
---|---|
2A23 | 8 |
2A24 | 7 |
3A45 | 3 |
2A44 | 1 |
6A18 | 8 |
4A08 | 2 |
数据映射由一组值组成,其中组合可以匹配集合中的任何值,如下所示:
- df1 中的 ('A','C','F','K','M') 应映射到 df2 中的 (2, 8) - 2 或 8
- df1 中的 ('B') 应映射到 df2 中的 4
- df1 中的 ('D','G','I') 应映射到 df2 中的 7
- df1 中的 ('T','U') 应映射到 df2 中的 (3,5) - 3 或 5
请注意,df1 的 cp_code 为 R 未映射,并且 3A45 不匹配。好消息是有一个唯一的标识符密钥可供使用。
首先,我为每个映射集创建了一个列表,并使用 merge 创建了一个语句来检查每个映射。我最终得到了每组 3 个列表和 3 个语句,我不确定这是否是正确的方法。
最后,我想将匹配项合并到一个我称为 match 的 df 中,将所有 no_matches 合并到另一个我称为 no_match 的 df 中,并将所有 no_mappings 合并到另一个我称为 no_mapping 的 df 中,如下所示:
匹配
cp_id | cp_code | cp_type_id | cp_type_code |
---|---|---|---|
2A23 | 一个 | 2A23 | 8 |
2A24 | D | 2A24 | 7 |
6A18 | ķ | 6A18 | 8 |
不匹配
cp_id | cp_code | cp_type_id | cp_type_code |
---|---|---|---|
3A45 | G | 3A45 | 3 |
无映射
cp_id | cp_code | cp_type_id | cp_type_code |
---|---|---|---|
7A96 | 乙 | 钠 | 钠 |
钠 | 钠 | 2A44 | 1 |
2A30 | R | 钠 | 钠 |
钠 | 钠 | 4A08 | 2 |
我很难让 no_match 起作用。这是我尝试过的不匹配的:
- 根据设置的 2 个代码过滤 df1
- 基于不在地图 2 代码中的过滤 df2
- 对于无映射,我使用 on='cp_id' 进行了 df 合并
使用上面的代码,例如,对于 cp_id = 'B',我得到了很多 cp_id = 'B' 的重复行,而不是只返回 1 行。
只是为了说明我的水平,我是 Python 的初学者。任何帮助,将不胜感激。
非常感谢您的参与。
抢
data-integration - 在数据集成之前我需要一些数据字段映射工具
在数据集成当前我需要一些数据字段映射工具我正在使用excel并从源和目标复制数据字段每次在源或目标系统中添加新字段时,我都需要更新excel表。我希望该工具应自动识别新字段并同步
flutter - 如何在flutter中映射嵌套json对象中的数据
在这里,我从 API 获取此 JSON 对象,我需要将其添加到列表并返回,以便我可以从快照中获取它以显示数据。但我将 snapshot.data 获取为 null。请帮我解决这个问题问题。
这是到目前为止我如何尝试的代码。
从下面的代码中,我尝试访问数据,但 snapshot.data 为空并且页面正在加载。
mule - mule3 到 mule 4 表达式到 dataweave 2.0
我是将 mule 3 应用程序迁移到 mule 4 的新手 我几乎完成了转换但是一个表达式停止了我的流程并且无法实现它的逻辑如果有人对要转换的表达式有想法请帮助我
表达:
我已经尝试了对上述代码的了解,但我仍然遇到问题
performance - Google Scripts - 使用 For 循环进行数据映射加载数据非常慢
我对谷歌脚本相当陌生。我一直在从 VBA 翻译一个人的代码来为我的属性编写我自己的数据库。目标是将属性数据存储在属性数据库表上,并拥有另一个“摘要表”,允许我查看选定属性的数据,对其进行编辑并将其更新到数据库中。
我通过将汇总表中的单元格 a1Notation 放在数据库表中相应单元格的上方来使用数据映射。我使用for Loop将数据库表中所选属性数据加载到摘要表中,该摘要表在选择属性时使用ONEDIT执行。问题是它太慢了。见下文。我能做些什么来加快速度吗?谢谢!
定义:
将属性数据从属性数据库 (sheetPropDB) 加载到汇总表 (sheetProp)。这是非常慢的部分:
reactjs - 优化从 getStaticProps 接收的数据的渲染(数据有时在初始渲染时不可见)
我在 NextJS 应用程序的主页上运行了一个函数,该函数接收从 getStaticProps 收到的道具。唯一的问题是,在 iOS 和 Mac 上,使用 Safari/DuckDuckGo 浏览器时,页面偶尔会(大约每 5/6 次无缓存重新加载以隐身模式)加载 -all- 内容......但没有一个是可见的。
您仍然可以复制和粘贴文本,您可以按下图像然后查看它们,但唯一可见的是标题背景颜色和 HTML/正文背景颜色。但是,它在所有操作系统上 100% 的时间都在 Chrome 中运行。
如果您认为问题出在此函数的长度和/或方法上,您能否为我提供有关如何压缩它或使用更好实践的指导?
如果您认为问题出在其他地方,我很想知道从哪里开始寻找。控制台没有显示任何问题。
这是正在渲染的组件:
这是我编写的用于组织渲染数据的函数:
当它起作用时: 图1
r - 映射非数字因子以在 R 中的两列之间选择更高的值
我有一个包含两列的数据框:PathGroupStage、ClinGroupStage。我想创建一个选择更高阶段的新列 OutputStage。
阶段有效值:I,IA,IB,II,IIA,IIB,III,IIIA,IIIB,IIIC,IV,IVA,IVB,IVC,未知。
- 如果两个阶段都有值,则使用最高的,例如 IIIB > IIIA > III
- 如果一个缺失而另一个有价值,则使用有价值的那个
- 如果两者都丢失或未知,则 .= 未知
如何比较两列中的非数字值导出 OutputStage 变量?我想我需要考虑水平,但我将如何比较不同列之间的因素?
这是示例数据集:
excel - 是否可以从 Excel 源中批量读取多张工作表?
目前,我正在使用 Astera-Centerprise 从 Excel Source 读取数据。Astera Centerprise 可以选择从 Excel 读取工作表。但是,如果一个 Excel 文件有多个工作表(工作表 1、工作表 2、工作表 3)并且我们想读取所有工作表。我是否需要创建 3 个 Excel 源并一一分配 sheet1、sheet2 和 sheet3?或者我可以一批读完所有 3 张纸吗?
flutter - 如何在flutter中调用body中的函数并将数据传递给函数
由于代码如此庞大且超过 1000 行,我无法放置完整代码,我可以放置一些信息代码,在其中调用函数并从服务器获取数据,我想将这些数据显示在 home 的正文中,我已经为 homebody 创建了一个单独的文件并在主页中调用它。但我无法在正文功能中传递服务器数据,谁能帮帮我,我是一个初学者
在这里,我想在另一个名为的文件中准备的函数中传递数据