问题标签 [merging-data]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
ruby-on-rails - 合并 Rails 中的两个/三个记录
我想将两个配置文件合并为一个。在 Rails 中执行此操作的最佳方法是什么。
我有两个配置文件user1
,user2
并且至少有 30 个表与它们相关联。
现在我想将它们合并在一起,以便应该有一个配置文件说user1
并且user2
应该被删除,但现在的所有关联数据都user2
应该与user1
。
例如:假设user2
有两个联系人,user1
合并后有 3 个联系人,用户user1
应该有 5 个联系人。
excel - 尝试将多个文本文件的内容合并为电子表格中的每个单元格
本质上:
我有几个 (400) 文本文件,每个文本文件都有一个数字文件名(即 12345.txt)。
每个文本文件都包含一些文本(长描述样式、纯文本段落等)。我想弄清楚是否可以将所有这些文本文件导入电子表格以导出为 CSV。
该工作表将有两列:没有扩展名的文件名(12345),第二列是文件的内容(每个文件一个单元格)。
谢谢。
perl - 用于将 2 个文件与多个条目组合的 Perl 脚本
我有一个制表符分隔的文本文件,如下所示:
还有一个是这样的:
我需要将它们组合起来,以便一个文件的每个“多个”条目被复制并在另一个文件中填充其数据,这样我得到:
我几乎没有编写脚本的经验,但是在其中一个文件中只出现了一次“contig11”,并带有散列/键。但我什至无法开始做这件事!非常感谢有关如何解决此问题的一些帮助或提示。
编辑所以我尝试了 ikegami 的建议(见答案):但是,这产生了我需要的输出,除了 GO:100 列以后(脚本中的 $rest ???) - 任何想法我做错了什么?
git - 如何最好地通过 SSH 合并 Git 更改
我有一种感觉,我正在以错误的方式解决这个问题。
我有一个软件项目,其中有 3 名开发人员都在自己的 GIT 存储库上进行频繁的更改。他们将更改推送到服务器,然后我将更改合并并发布到实时网络软件。
我一直在尝试找到一种解决方案,当我合并代码时可以轻松地使用它来解决冲突(每次合并通常都会有一堆冲突)。我的经验是,仅 VIM 在这方面非常慢,但我发现了一个名为 Splice 的程序: http ://sjl.bitbucket.org/splice.vim/ 我正在尝试掌握它。然而,似乎即使是这个程序也会在主页上告诉你:
“Splice 是一种合并工具,这意味着您将在您的开发机器上使用它,而不是通过服务器上的 SSH。”
通过 SSH 在生产服务器上进行合并有那么大吗?每次我必须合并代码时,抓取服务器上的所有代码、下载、合并和重新上传似乎是一个更大的痛苦。
我对此很陌生,但我觉得我错过了一些东西。有没有更好的方法来解决这个问题?
欢迎所有建议:)
excel - 希望使用 Python 2.7 按 ID 将两个 Excel 文件合并为一个 Excel 文件
我是 Python 家族的新手,几天来一直在尝试解决合并两个 Excel 文件的问题。我无休止地研究了合并,并试图调整我的代码以满足我的需求,但它一直没有奏效。我想知道我是否可以就我的代码为什么不工作获得任何帮助。我觉得这可能是其他使用 Python 的人的常见问题,所以希望这也能帮助其他人。我很感激任何评论!
我有两个 Excel 文件,“Chinese Scores3.csv”和“Chinese Scores4.csv”,我试图通过一个 ID 合并它们,每个公司都是唯一的。除了公司 ID,每个 Excel 文件都没有匹配的列。此外,并非所有公司都列在这两个文件中。有些列出了两者,但其他列出了一个或另一个。我想将公司 ID 的所有信息一起附加到 Excel 表上的一行中。即第一个excel文件列是ID、JanSales、FebSales等,第二个excel文件列是ID、CreditScore、EMMAScore等。我要创建的excel文件有列:ID、JanSales、FebSales、CreditScore、EMMAScore全部根据公司ID。
这有意义吗?这就像在 excel 中使用 VLOOKUP,但我想使用 Python 来做到这一点。无论如何,这是我的编码,它不起作用。我尝试操纵它,但它不起作用。我希望得到反馈!
google-bigquery - 在 BigQuery 中合并两个失去关联的数据集
我是 BigQuery 的新手,非常感谢您的帮助。我试图保持我的案例通用,以便对其他人有用。我敢肯定这是非常基本的,我错过了一些东西......
我有 2 个数据集,“Master”和“New”。Master 包含几列,并且已经有很多行。我想将一个新数据集合并到主列表中,但是这个新数据集中的条目可能在所有列中都有值,也可能没有。此外,新列表中的值可能已经或可能不存在于主列表中。两者都有一个唯一/主键(例如 Col1) 例如:
掌握:
Col1 | Col2 | Col3 | Col4
VAL11 | VAL12 | VAL13 | VAL14
VAL21 | VAL22 | VAL23 | VAL24
VAL31 | VAL32 | VAL33 | VAL34
新的:
Col1 | Col5 | Col6
VAL11 | VAL15 | 无效的
VAL41 | VAL45 | VAL46
以下是我的问题:
1)为了合并两个数据集,我必须写什么 bigquery,具有以下要求:a)值应该合并到记录中,例如,当 master 中的前一条记录在某处有“null”时,新数据集有它的价值,那么它应该出现在那里。b) 如果存在“冲突”,则旧值应被新值覆盖
我认为这基本上只是一个完整的外连接,但 BigQuery 只支持内连接和左外连接......
2)如果有可能,使用更多嵌套的逻辑,我希望能够以更精细的方式做2b),例如“如果存在冲突,并且原始值为X,则覆盖,否则不要覆盖/保留该列的原始值(该记录的其他值将不受影响)。
3)如果可能的话,使用一些更嵌套的逻辑,我想能够说“如果 val34 和 val36 都是 TRUE,那么也将 val38 设置为 TRUE,否则如果 val37 是 X,那么将 val38 设置为X”
现在,这是 3 个不同但相关的问题,如果你能帮助我解决任何一个问题,那就太好了。顺便说一句,我正在使用 bigquery,因为数据集太大,普通数据库无法处理,而且它是一个非常方便的工具,我可以轻松地在整个团队中共享。
非常感谢您的帮助和指点!
ps 这里是 BigQuery 文档https://developers.google.com/bigquery/query-reference
pdf - 在不破坏标签的情况下合并标记的 PDF
我正在尝试将两个标记的 PDF 与 iTextPDF 5.4.4 版本的 jar 合并。完成所有操作后关闭文档就行了:document.close();):。它抛出以下错误
请让我知道可能导致此问题的原因。
下面是我使用的代码。
r - SAS 到 R 的合并转换
我目前正在将 SAS 宏转换为 R 代码。我在 R 上做了很多工作,但我对 SAS 比较陌生。我无法理解合并命令的 SAS 代码 -
我了解此命令将文件 A 加入自身 5 次。但我无法可视化输出。'index+1' 和 'if' 代表什么。此代码的 R 版本是什么?
performance - 让服务器为用户合并 PDF 是否太耗费资源?
我正在做一些研究,试图找出执行以下操作是好主意还是坏主意。
- 用户会做出选择
- 根据选择,我们的网站会将这些选定的 PDF 合并在一起
- 用户可以下载合并的 PDF。
我知道有“Java Open Source PDF Libraries”和“PDFBox”之类的东西,但我的主要问题是……</p>
这会不会太服务器密集?
r - 合并具有不同大小和缺失值的两个数据框
我在合并 R 中的两个数据帧时遇到问题。
第一个由 6 个变量的 103731 个 obs 组成。我必须用来合并的变量有 77111 个唯一值,其余的是NA
值为 0 的 s。第二个包含这些变量的频率加上NA
s 的频率,因此 77112 个 obs 的帧用于 2 个变量。
我需要得到的结果帧是第一个与合并变量的频率相结合的帧,因此 df 为 103731 obs 与合并变量的每个值的频率(因此如果 freq > 1 以及每个NA
(或0))。
有谁能够帮我?
我现在得到的结果包含一个 1 894 919 obs 的数据框,我使用了:
我也用 ' ' 玩了很多,all=
但没有一个变化给出了正确的 df。