问题标签 [data-manipulation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
858 浏览

r - 使用 R 透视 CSV 文件

我有一个看起来像这样的文件:

我正在使用的数据集可以在https://github.com/aronlindberg/VOSS-Sequencing-Toolkit/blob/master/twitter_exploratory_analysis/twitter_events_mini.csv上访问。

我想为“repository_name”列中的每个条目创建一个表(例如bootstrap、hogan.js)。在该列中,我需要具有与该条目相对应的“类型”列中的数据(即,只有当前“类型”列中的行在当前“repository_name”列中也具有值“bootstrap”应属于新的“引导”列)。因此:

  • 时间戳仅用于排序,不需要跨行同步(实际上它们可以删除,因为数据已经根据时间戳排序)
  • 即使“IssuesEvent”重复 10 次,我也需要保留所有这些,因为我将使用 R 包 TraMineR 进行序列分析
  • 列可以不等长
  • 不同存储库的列之间没有关系(“repository_name”)

换句话说,我想要一个看起来像这样的表:

我怎样才能在 R 中做到这一点?

我使用 reshape 包的一些失败尝试可以在https://github.com/aronlindberg/VOSS-Sequencing-Toolkit/blob/master/twitter_exploratory_analysis/reshaping_bigqueries.R上找到。

0 投票
31 回答
1029813 浏览

javascript - 如何访问和处理嵌套对象、数组或 JSON?

我有一个包含对象和数组的嵌套数据结构。如何提取信息,即访问特定或多个值(或键)?

例如:

我怎样才能访问name中的第二项items

0 投票
1 回答
3452 浏览

sql - 将分类值转换为布尔列 SQL

我正在寻找“扁平化”我的数据集以促进数据挖掘。每个分类列应更改为多个布尔列。我有一列包含分类值,例如:

我正在寻找一种方法来透视这个表,并有一个聚合函数告诉我这个 ID 的值是 A 还是 B:

结果:

我尝试使用 PIVOT,但不知道在其中使用哪个聚合函数。

还在SF中寻找答案,但找不到任何答案...

我正在使用 MS-SQL 2012。

任何帮助,将不胜感激!暗里

编辑:

col1 中的类别数量未知,因此解决方案必须是动态的。谢谢 :)

0 投票
1 回答
425 浏览

r - 使用 R 将 CSV 文件切割成不同的列

这是使用 R 透视 CSV 文件的后续问题。

在那个问题中,我想根据列(repository_name)中的值将单个列(类型)分成几列。使用了以下输入数据。

完整的 CSV 文件可在https://github.com/aronlindberg/VOSS-Sequencing-Toolkit/blob/master/twitter_exploratory_analysis/all_events.csv上找到。

这是 CSV 前 30 行的 dput():

提出此代码的@flodel 很好地回答了这个问题。

但是,现在我想对列表进行排序,以便每个 repo(repository_name)的事件(类型)每月按一列排序(从“created_at”列中提取),如下所示:

其他一些假设是:

  • 时间戳仅用于排序,不需要跨行同步
  • 即使“IssuesEvent”重复 10 次,我也需要保留所有这些,因为我将使用 R 包 TraMineR 进行序列分析
  • 列可以不等长
  • 不同存储库的列之间没有关系(“repository_name”)
  • 同一存储库不同月份的数据完全独立

我怎样才能在 R 中做到这一点?

0 投票
2 回答
1935 浏览

r - 在 R 中编辑 CSV 文件的列名

我有一个简单的 CSV 文件:

如何在列名中添加特定的整数或字符串,比如 1 或“June”?我期望的输出是:

0 投票
3 回答
306 浏览

php - 操作数据的最佳实践

我有一些 JavaScript 执行来自服务器的 ajax 请求,该请求将返回 JSON 数据。尽管此数据是 JSON,但它不正确,因为脚本要求数据基于数组且不包含对象。

一位同事建议使用客户端解决方案,通过重新创建 JSON 数据,将基于对象的 JSON 转换为基于数组的 JSON。

我觉得它应该更像是服务器端,因为我觉得您永远不应该依赖客户端浏览器来进行此类过滤?做这样的数据结构操作不是服务器的工作吗?

(我的意思是服务器端 - 在从 AJAX 请求接收数据之前,在客户端做同样的事情,但在 PHP 中)

这样做的最佳做法是什么,如果可能的话,解释每一方的利弊?

感谢您的时间。

0 投票
5 回答
3065 浏览

r - 在 R 中有效地居中一个大矩阵

我有一个大矩阵,我想居中:

使用 colMeans 可以快速有效地找到均值:

但是从每列中减去各自的平均值有什么好的(快速且内存效率高)的方法?这有效,但感觉不对:

有没有更好的办法?

/edit:这是 DWin 在更大矩阵上编写的各种基准测试的修改,包括其他发布的建议:

matmult 函数似乎是新的赢家!我真的很想在 5e+08 元素矩阵上尝试这些,但我一直用完 RAM。

0 投票
1 回答
864 浏览

r - 连接嵌套在 R 中的列表中的数据框的更好方法

我有一个包含嵌套列表的列表对象,每个列表都包含一个数据框。下面的代码模拟了我的数据结构:

我正在寻找行绑定我的所有数据框以创建一个主数据框。目前我使用一个for循环来完成这个动作:

实际上,我的主列表非常大 - 长度为 3700,而不是 5 - 所以我的for循环非常慢。

有没有更快的方法来完成相同的任务?

0 投票
1 回答
117 浏览

r - 时间序列数据操作

我之前也遇到过这个问题,但是我没有写下解决方法,所以现在又遇到麻烦了!

我有一个如下的数据框:

换句话说,日期/产品的每个组合都有一行,每个组合的数量和收入信息。

我想重新排列此数据框,使其如下所示:

换句话说,我希望每个日期都有一行,产品/信息(数量,收入)的每个组合都有一列。

我怎样才能做到这一点?提前致谢!

0 投票
2 回答
933 浏览

r - 在 R 中重新排列数据框

我有一个看起来像这样的数据框:

现在我想按月/年重新排列它(仍然按时间排序,并且仍然保持行的完整性)。这应该为每个月创建 3 列,然后将与该月相关的所有数据(created_at、actor_attributes_email 和类型)放在这 3 列中,以便我得到以下标题(对于数据中存在的所有月份):

我怎样才能在 R 中做到这一点?

包含整个数据集的 CSV 文件可以在这里找到: https ://github.com/aronlindberg/VOSS-Sequencing-Toolkit/blob/master/rubinius_rubinius_sequencing/rubinius_6months.csv

这是dput()CSV 的第一行:

其他一些假设是:

  • 即使“PushEvent”(例如)重复 10 次,我也需要保留所有这些,因为我将使用 R 包 TraMineR 进行序列分析
  • 列可以不等长
  • 不同月份的列之间没有关系
  • 某月内的数据应以最早的时间优先排序
  • 例如,2011 年 6 月和 2012 年 6 月的数据需要在不同的列中