“merging-data”的相关标签问题

0 投票

1 回答

28 浏览

python - 合并填充的行单元格并忽略Python中的空单元格

经过一些数据预处理后，我坚持合并数据集。我想要做的是根据相同的批次号将同一列下的所有日期按行顺序合并。通常它是堆叠的数据，然后我根据流程步骤（40,42,50）进行了堆叠。那么我的意图是将两列的时间差作为分钟。

数据集：

我想要的是：

2019-12-16T13:47:31.217

0 投票

2 回答

327 浏览

python - 如何合并保存元数据的不同matlab mat文件以在python中使用？

我有 1,000 多个非常长的matlab向量（长度不等~ 10^8 个样本），代表来自不同患者和来源的数据。我希望将它们紧凑地组织在一个文件中，以便以后在python. 我希望每个样本以某种方式保存其他信息（患者 ID、采样频率等）。

顺序应该是：

我想过将样本转换为hdf5文件类型并添加元数据，然后将几个hdf5文件合并为一个文件，但我遇到了困难。

已经尝试过：

matlab：高级 hdf5 matlab 函数。
matlab：将变量保存为 v7.3 mat（实际上是 hdf5）
蟒蛇：sidekit_io.h5merge

公开征求意见！

python matlab bigdata hdf5 merging-data

2020-01-01T21:11:12.953

0 投票

1 回答

231 浏览

etl - 想要在聚合器阶段以外的数据阶段实现逻辑

除了聚合器阶段，我想实现这个逻辑，基本上是通过转换器阶段根据 ID 列合并这些记录，并且在我的情况下，对于同一个 ID 列，不可能为同一字段获取多个值。

我有这个输入数据，

ID|VAL1|VAL2|VAL3|BAL1|BAL2|BAL3

10001|5|0|0|1000|0|0

10001|0|10|0|0|1200|0

10001|0|0|11|11|0|10500

我希望我的输出是这样的：

ID|VAL1|VAL2|VAL3|BAL1|BAL2|BAL3

10001|5|10|11|1000|1200|10500

是否有可能实现它，如果，那么提前谢谢！！！！

etl datastage merging-data

2020-02-21T15:05:18.877

0 投票

1 回答

27 浏览

python - 数据合并 Pandas

我在不同的机器上运行了一些 pcmark 测试。最后我想巩固机器结果。我已经修改了最终结果以显示。我尝试过使用 pandas 进行不同形式的合并，但我无法得到预期的结果，但这已经足够接近了。任何建议，将不胜感激

来自机器 1 的数据帧：

来自机器 2 的数据框：

我希望结果如下所示：

我尝试了结合所有键的外部合并，这就是我得到的。使用外部函数将 pcmark10 的行值引导为空白。应用列中缺少 Chrome。

合并命令：- pd.merge(df1, df2, on=['Test Case', 'SubTest', 'App'], how="outer", indicator=True)

python pandas dataframe merge merging-data

2020-03-17T11:29:33.750

0 投票

0 回答

25 浏览

python - 熊猫数据合并

我是熊猫新手。有什么办法可以将这两个数据框合并到以下结果中

数据框1：-

数据帧2：-

数据帧结果：-

使用左操作合并没有帮助。行数增加，而不是NaN，它输入前一行值

python pandas merge merging-data

2020-03-17T12:50:07.790

0 投票

0 回答

16 浏览

r - 如何通过匹配国家/地区名称来合并/加入我的数据中的 lon 和 lat？

我正在尝试绘制地图。我需要将 ggmap 中的 lon 和 lat 数据合并/加入到我的数据中。

我的数据集看起来像这样

数据世界 <- read.dta(file="arrival.dta")

我的数据集如下所示：

世界地图数据是这样的；

世界地图：

两种数据的观察结果不同。我试过 leftjoin 内连接等。它失败了。

建议我如何通过匹配国家名称来加入和组合这两个数据。

r inner-join merging-data

2020-03-27T07:40:23.797

0 投票

1 回答

97 浏览

json - 无法将多个 Jsonb 行合并为一行

需要合并我的单个 jsonb 列的所有行。

例如：我的 jsonb 列的行如下所示。

我的输入数据是（2行）：

运行此查询时，

我得到以下输出，

如果我尝试使用 jsonb_object_agg 按键添加值，jsonb 会消除第一个值并仅保留第二个值。

如果我尝试使用 json_object_agg，我会得到重复值

我的预期输出是

在一行中。

尝试了网上几乎所有的解决方案。这是我尝试过的几个链接。

json postgresql concatenation jsonb merging-data

2020-04-25T08:24:10.633

0 投票

3 回答

618 浏览

python-3.x - 将文本格式的电子邮件合并到一个 csv 文件中以进行机器学习

我正在使用安然数据集来解决机器学习问题。我想将所有垃圾邮件文件合并到一个 csv 文件中，将所有 ham 文件合并到另一个 csv 文件中以供进一步分析。我正在使用此处列出的数据集：https ://github.com/crossedbanana/Enron-Email-Classification

我使用下面的代码来合并电子邮件，并且能够合并它们。但是，当我尝试读取 csv 文件并将其加载到 pandas 中时，由于以下原因出现错误ParserError: Error tokenizing data. C error: Expected 1 fields in line 8, saw 2

将txt中的电子邮件文件合并到csv中的代码

python-3.x pandas csv merging-data

2020-04-27T05:39:33.427

0 投票

0 回答

37 浏览

r - 按ID合并了两个数据集，现在观察多了

R社区。因此，我将 csv“clin”与 csv“cpath”合并，以创建我的数据框“mint”。临床是 265 obs。62 个变量。cpath 是 64 个变量中的 169 个。薄荷是 270 的 2 个变量

我通过“kitid”变量（7位数字）合并了csv文件；因此，每个数据行都应该包含特定 kitid 的 clin 和 cpath 信息。（对于 cpath，kitid 被命名为“kitid2”，对于 clin 被命名为“kitid”，以帮助合并功能）

我在每个 csv 和“mint”数据框中搜索 kitid 中的重复项，但没有。

我确实注意到，在比较 mint$kitid 和 mint$kitid2 列时，“mint”数据框中只有一行具有 cpath 的 kitid，但没有 clin。这可以解释有 266 个观测值而不是 265 个观测值，但仍有 4 个数据行没有解释。

有谁知道额外的 4 个数据行可能来自什么？什么可能导致这种情况？

请帮忙！谢谢你们！

r merge duplicates merging-data

2020-05-15T00:36:27.940

0 投票

0 回答

31 浏览

javascript - 如何在要更新子对象中的单个参数的地方将 2 个对象合并在一起

更新
由于发布了这个问题以及某人在下面的评论中提供的链接，$.extend 方法只深入了一层，这解释了我遇到的问题。使用下面链接中提到的解决方案将解决问题。

如何深度合并而不是浅合并？

作为我为我的内部系统构建的 javascript 工具的一部分，我接受一个对象作为类的参数。提供的对象使用$.extend() Jquery 方法与默认设置对象合并。默认设置对象包含类的每个选项，其中包含用于自定义之类的嵌套对象。

我遇到的问题是，如果用户更新嵌套对象中的参数，它似乎会完全覆盖第一个嵌套对象，而不是仅仅覆盖他们在通过$.extend()方法运行时更改的参数。我怎样才能做到这一点，以便用户可以在创建类的实例期间更改嵌套对象中的参数，同时保留该嵌套对象中的其他参数？

默认设置对象如下：

我提供的设置对象：

然后我在类中使用$.extend()方法：

javascript jquery object merging-data

2020-05-16T17:27:02.453

问题标签 [merging-data]

Reference