问题标签 [wrangle]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
83 浏览

r - 在 R 中整理数据

我想从下图中的左表转到右表,但似乎无法找到背后的编码逻辑来使用 R 达到结果。

非常感谢您的帮助 !

0 投票
2 回答
47 浏览

r - 使用 tidyverse 在 R 中进行数据整理?

所以我有这个数据集主要的转换是旋转表格,所以人口名称在第一列,名称是每列的标题(并且它们被重命名,因此叶绿素被重命名为 CHLa)。表格被旋转和重命名后的另一个变化是,每一行都被复制到指定的数量,所以在预览中如果你注意到,AK 被复制了 8 次,NU 被复制了两次,依此类推。谁能帮我完成这个?谢谢!

0 投票
1 回答
27 浏览

r - 在 R 中争吵数据帧,可能使用 dcast

我有一个相当大的 data.frame,我必须对其进行一些处理。目前的结构是:

例如对于 data_frame:

我最终想要的是这样的表格:

到目前为止,我在 R 中尝试过的是:

samples_data <- seq(from = 5, to = dim(df)[2],by=2) variable_data <- samples_data + 1

new_df <- reshape2::dcast(df, V1 + V2 + V3 ~ colnames(df)[samples_data], value.var= colnames(df)[variable_data])

但我收到此错误消息:

有没有人对如何解决这个问题或如何重塑 df 有任何建议?

谢谢!

0 投票
0 回答
40 浏览

r - 日期数据集与 R 中的时间线争吵

我有在数据集中使用日期的复杂问题。让我描述问题并举例说明。

数据是医院数据,其中我们有人员获得最终诊断时的信息(key_date)和人员住院时的事件数据(date_in,date_out)。

我们希望将所有患者放在同一时间线中,以便在新的规模中,每个人都在点 0 进行诊断。与此相关,我们还将 date_in 和 date_out 变量缩放到该时间线。

接下来我们要计算诊断前 1 年、2 年等有多少患者住院。例如,前 3 行原始数据的数据如下所示:

这意味着天数被计算为医院人员在新的缩放日期变量中的天数。同一“事件”有可能被划分为两年或更多年。年在这里表示 365 天,此参考表有助于了解每年的天数限制:

进行此计算的最佳和最快方法是什么?我知道这可以通过 for-loop 遍历整个数据集并检查哪些行标识为年份来完成,但我发现它很慢。想法是获取带有变量的数据框

  • 年份:根据时间线变化。1,2,3,4,… 诊断前 1,2,3,4,… 年诊断后
  • 病人:不同的身份在医院里有多么不同
  • 天数:患者一年中住院天数

这种数据争论的整个想法是在“真正”诊断之前可视化患者住院天数的增长情况。最有可能的真实数据看起来像这样

在此处输入图像描述

0 投票
1 回答
76 浏览

r - Unpack json columns into a dataframe

I have json strings inside a dataframe column. I want to bring all these new json columns into the dataframe.

Using the jsonlite library I can make each json string into a 1 row dataframe.

Unfortunately the JsonID variable column is lost. All json strings share common column name such as "time". But there are column names they don't share. By pivoting the data longer I could Rbind all the dataframes together.

Is there a better way to do this?

I have never worked with json strings before. The solution must be computationally scalable.

0 投票
1 回答
472 浏览

r - 用 tidyverse 改变特定的列

快速提问:有人可以告诉我如何在 dplyr 语法中执行以下操作吗?

Col 1 - 5 是角色,我希望它们成为因素。但是,使用 dplyr 我没有完成工作。我的猜测是:

但是由于选择功能,这会删除所有其他列。此外, mutate_if 在这里并不是很有帮助,因为我还有其他字符是我不想更改的字符。

非常感谢。

0 投票
2 回答
72 浏览

python - 如何减去两个不同数据帧之间的行并替换原始值?

我有两个数据框,如下所示。如何通过 3 减去 10 和 2 减去 55 来替换 Bank1 数据?

在此处输入图像描述

在此处输入图像描述

所需输出(仅替换 Bank1 中的值):

银行名称 价值1 价值2
银行1 7 53
银行2 15 65
银行3 14 54
0 投票
0 回答
23 浏览

r - 如何反映 xlsx 文件中所做的更改?

我正在尝试从一个驱动器中的共享 excel 文件中处理数据。我已将一个驱动器同步到我的 macbook,因此我可以轻松地通过路径在 r 中访问它。我有以下代码:

我不确定这个问题是否需要更多代码,但我只是继续组织数据:

我的问题出现在这一点上。正如我所说,我正在使用来自共享 excel 文件的数据,并且我希望能够运行此代码几次以进行分析,以反映新更改/添加的数据。当我进入 excel 文件并更改某些内容时,它不会反映在我的工作目录中的 df 中,所以我不确定它是否有效/解决此问题的方法。

0 投票
2 回答
43 浏览

r - 我怎样才能更广泛地旋转并转换我的数据框?

我有一个这样的数据框:

ID 学校 城市 年级 Number_Students 类型_学校
1 1 一个 7日 20 上市
2 1 一个 7日 23 上市
3 2 7日 25 私人的
4 3 C 6日 21 上市
5 3 C 8日 28 上市
6 4 8日 34 私人的

分析单位是教室,但我想把它变成一个数据框,其中分析单位是学校,但有一些计算。像这样:

学校 城市 N_6th N_7th N_8th 学生_6th 学生_7th 学生_8th 类型_学校
1 一个 0 2 0 0 43 0 上市
2 0 1 0 0 25 0 私人的
3 C 1 0 1 25 0 28 上市
4 0 0 1 0 0 34 私人的

我正在尝试使用 pivot_wider(),但这还不足以满足我的需求。我需要将每所学校同一年级的教室数量和每所学校同一年级的学生人数相加。