问题标签 [merging-data]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
393 浏览

mysql - Mysql合并多个具有相同ID的记录忽略空字段

我希望将多个具有相同 ID 的记录合并到每个 ID 的一条记录中。我不得不使用数据透视表从多个其他表中获取我需要的数据,并进入一个看起来像这样的临时表:

我想找到一种方法将具有相同 ID 的所有记录合并到一个新表中的新记录中,如下所示:

我已经查看了此处和其他网站上的多个其他类似问题,这些问题似乎正在处理字段中的数值,例如这个(将具有相同 ID 的多行合并到一行)。这些都没有预期的效果。任何帮助,将不胜感激。

0 投票
1 回答
42 浏览

python - 在 Pandas 中连接时数据未将分隔符应用于 csv 文件

我有一组要连接的 csv 文件。我遇到了连接文件未将逗号分隔符应用于内容的问题。下面给出的是代码:

任何人都可以指导我。谢谢

0 投票
1 回答
35 浏览

python - 如何将一个 df 的列条目匹配到另一个 df;如果它们相同,请将另一列的条目从第一个 df 附加到第二个 df?

语境:

我有两个具有以下设置的数据框:

df1 看起来像这样......并继续大约 3500 行:

df2 看起来像这样......并且持续大约 4000 行和大约 8 列

NOTE1:一些id1s,没有id2s。这意味着当它们被映射时它们将是 NaN;每当我到达那一步时,我都会放弃它们。我不知道这是否相关,但我只是想添加它以防万一。

问题:

如果 df2 的 id1 条目 == id1 条目,我需要将相应的 id2 名称附加/加入/放置(此处不知道正确的行话)到第二个数据帧。我该怎么做呢?

所需的数据框如下所示:

我觉得这可能真的很简单,而且我有点傻,因为我是 Pythoner 新手。但是,我无法使用类似问题的回答来实现我的目标。不过,这很可能是我的错:p

在此先感谢您的帮助!

编辑更改了 4000 个条目 --> 4000 行。同样对于 3500 个条目

0 投票
0 回答
32 浏览

ontology - 如何从描述逻辑知识库中提取/构建领域模型

希望我的问题不是微不足道的或已经在其他地方得到回答。

问题描述 假设我们有一个代表软件架构
的 DL 知识库K mySys = (T sys , A mySys ) 。K mySys知识对软件组件(例如,API、存储、DB、服务器等)及其通信(例如,协议、授权、权限、数据流等)进行建模。术语部分 T sys在几个可能的模型之间共享,断言部分 A mySys是构成我的特定软件的资源的实例化。
现在,我们还假设我们有一个 DL“领域知识” K d = (Td , A d )包含特定领域的概念和角色定义,以及可能的个体。这种“领域知识”可以被认为是我们想要与我们的软件模型结合以起草某种报告的额外知识:例如,它可能包含与安全性、访问控制、密码学相关的概念。K mySys
中的一些知识与K d “相交” ,而另一些则不相交。相交的知识与领域建模相关,其余的不相关,可以丢弃。

问题
是否有任何程序:

  1. 使用来自K mySys的个体,使用从T d中的定义推断出的断言创建一个新的本体 。
  2. 排除与域 d 无关的所有信息,即K mySys中不属于T d中任何概念的所有个人?
  3. 包括来自T d的所有信息,以便最终的本体是原始模型的一种特定于领域的模型?


简而言之:如何从知识K mySys中实例化现有个人的领域知识K d

我已经在谷歌上广泛搜索了关于这个问题的论文,并找到了关于本体合并、映射、匹配、投影等等的结果……但在我看来,问题的表述与我的情况不同. 这个问题隐约类似于合并,只是我想保留领域知识并丢弃不相关的系统知识。

我有点困惑......
这是投影问题吗?
这是一个合并问题吗?
有人可以指点我相关的研究吗?

0 投票
0 回答
595 浏览

python - 将多个 xlsx 文件合并到一张纸中

目前我正在尝试使用 python 将多个 excel 文件合并为一个。到目前为止,我所拥有的如下:

这可行,但它不会复制第一个标题,因此我知道每列的名称是什么。在我有读取frames_new = [df[1:] for df in frames[1:]]为的行之前,frames[1:] = [df[1:] for df in frames[1:]]但这会导致同一文件的多个副本。

我只需要复制一个标题,这样我就知道每一列的值。

非常感谢您的帮助,并在此先感谢您。

更新:

我尝试使用下面的帖子表明这是一个类似的问题,并且我将代码编辑为如下所示:

我得到的结果是左侧有 2 个额外的列,缺少一个列并且仍然没有标题。

0 投票
0 回答
19 浏览

python - 加权方法。0 样本单元合并

输入数据框看起来像

在此处输入图像描述

在上面的例子中,我需要写一个代码,如果我们有样本 0 的单元格,然后将它与上面的单元格合并,然后划分宇宙并相应地分配权重。

最终权重 - 输出数据

在此处输入图像描述

在上述情况下,将两个单元格中的 1000 个宇宙相加并除以 2000,然后除以 10 个样本,最终权重为 200(2000 个宇宙/10 个样本)

在上面的代码中需要帮助

0 投票
0 回答
126 浏览

python - Pandas:重命名列上的合并缓冲区错误

不幸的是,我无法分享我正在处理这个问题的实际数据,所以请耐心等待我尝试使用一个通用示例来帮助解释我看到的错误。

我有两个数据框,我们将它们称为df_localdf_global,我需要将它们合并以全面了解数据库中的数据。df_global大约有 16 列,其中最相关的是:['observation_id', 'min', 'max']. df_local有 4 列,['observation_id', 'local_id', 'min', 'max']. 但是,在两个数据帧之间,observation_id是相同的,但minmax意味着不同的东西。in df_localminandmax是局部最小值和最大值,而minand maxindf_global是该观察的整个数据集的实际最小值和最大值。

当我使用以下代码行合并两个数据框时:

df = pd.merge(df_global, df_local, on = 'observation_id', how = 'outer')

我没有收到任何错误并df返回列['min_x','max_x', 'min_y','max_y']。这是....很好...除了我想在合并之前重命名列,以便我知道哪个是本地的,哪个是全局的。

但是,当我将df_local的列重命名为['observation_id', 'local_id', 'local_min', 'local_max']合并时出现以下错误:

这与此处的此错误类似,因此我检查以确保两个数据帧中没有重复的列。我不。同样,仅当我df_local在合并之前尝试重命名 's 列时才会发生此错误。当我不重命名列时,我没有收到错误消息。

我不知道发生了什么,并在互联网上寻求帮助,甚至询问处理这些数据的常驻蟒蛇大师可能是什么问题。我们都被困住了。

对于无法提供实际数据来显示操作中的错误,我深表歉意,但我希望描述足以让某人找到解决方案。

编辑:

这是我可以展示的脚本。

什么有效:

什么不起作用:

0 投票
1 回答
306 浏览

sql-server - 对连续行进行排名或合并

我有一个日志文件,我需要排名(但将顺序和相等的行视为关系),或合并顺序相等的行(基于特定列)。我的表如下所示,开始和停止都是顺序的(在同一个 ID 窗口内)

我有两种方法可以得到我需要的东西。

方法 1:排名(将“值”中具有相等值的连续行视为关系)并使用 ID 作为分区。这应该给出下面的输出。但是我该如何获得特殊排名:将“值”中具有相等值的连续行视为平局。

方法 2:在“值”中合并具有相等值的连续行。 这将创建一个如下表。

我不知道这是否有帮助,但我还有一个 nextValue 列可能对此有所帮助

示例表:

0 投票
1 回答
29 浏览

sql - SQL消除重复,同时合并附加表

我有两个表,ADDRESSES和一个附加表CONTACTS联系人有一个 SUPERID,即他们所属的地址的 ID。我想在地址表中识别重复项(相同的姓名、名字和生日),并将这些重复项的联系人合并到最新的地址(最新的DATECREATE或地址的最高ID)。之后将删除其他重复项。

不过,我合并联系人的方法不起作用。删除重复的作品。这是我的方法。将不胜感激支持这里有什么问题。谢谢!

这是一个用于理解问题的示例。

结果应该是这样的

0 投票
1 回答
234 浏览

google-sheets - Merge Irregular Time Based Data Series

I would like to merge 2 Google sheets (INPUT #1 & INPUT #2) into 1 sheet (OUTPUT). These 3 sheets are enclosed in the same Google Spreadsheet.

On a daily basis, Sheets INPUT #1 & INPUT #2 are updated by the end of the data series.

OUTPUT should adapt automatically.

Can you help me?

enter image description here