“rowwise”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

90 浏览

r - 使用 dplyr 和 rowwise 采样

这是我的例子：

不幸的是，我不知道如何让每个人都重现相同的示例，但这是我在计算机上得到的输出

第一行显示了这一点col_1并且col_2是不同的，而我希望它们是相同的。此外，我期望col_1并col_2从set_diff列中抽样。有人可以帮我澄清我的错误吗？

r dplyr sample rowwise

2020-03-30T17:15:50.973

0 投票

1 回答

29 浏览

r - 将 setdiff 结果存储在数据框单元格中

这是我的例子：

它会产生一个错误：

出了什么问题以及如何解决？有什么想法吗？

更新：我的错，我只是忘了添加mutate

r dplyr set-difference rowwise

2020-03-30T19:10:39.263

0 投票

0 回答

196 浏览

hashmap - 如何仅使用 Java 7 按特定列名逐行对 csv 数据进行分组

csv的格式是

第 1 行：c1、c2、c3、c4、c5

第 2 行：1、a、b、c、d

第 3 行：1、n、b、c、l

第 4 行：2、j、k、c、l

第 5 行：3、a、i、v、i

第 6 行：1、a、b、c、d

第 7 行：1、a、b、u、i

分组应该在 c1,c2,c3 列的基础上进行，如果这三个列的值都相同，则将其分组如下：

GROUP1：第 2 行和第 7 行相同，地图应为 Map(Map(String, String),Map(String, String))

即一个键{c1,1},{c2,a},{c3,b}（再次键值对）

具有多个值作为

{c4,c},{c5,d}（键值对）

{c4,u},{c5,i}（键值对）

GROUP2：第 3 行的列值不同，因此地图应为

键{c1,1}{c2,n}{c3,b}

值{c4,c}{c5,l}

第 7 行应添加到错误映射中，因为第 2 行与第 2 行相同

最终地图应该是 Map of(group.Num,Objects)

列名应从属性文件中选取，如下所示。

已经进行了多次试验，但 group by 仅由 8 支持，但特别是我需要使用 java 7。有人可以在这里帮助我吗？我需要更多的想法来克服这个

hashmap java-7 columnname supercsv rowwise

2020-04-03T11:19:18.040

0 投票

1 回答

60 浏览

我有两个矩阵（mat1 和 mat2），具有相同的列数（每个 4 个）和不同的行数（一个矩阵有 3 个，另一个有 5 个）。我想将一个矩阵中的每一行与另一个矩阵中的每一行进行比较。行中的值和位置在两个矩阵中应该相同。我一直在尝试“应用”函数，但在定义函数时遇到了问题：apply(mat2,1,function(x){mat1[x,]==mat2 [x,]}其他类似的组合会导致消息“下标越界”。我在这个世界上很新（R 和编程），在网上有搜索信息，但我什么也没找到。我真的被困住了。非常感谢您的帮助。提前致谢。卡尔帕

r matrix compare rowwise

2020-04-03T11:46:14.707

0 投票

2 回答

138 浏览

r - rowwise() 使用 mean() 和 sum() 产生错误

我正在尝试获取跨行某些列的 mean() 和 sum()。此代码将生成数据集：

如果我尝试使用 rowSums() 或 rowMeans()，我会得到正确答案：

但是，如果尝试使用 rowwise() 后跟 sum() 或 mean()，它不起作用：

对于 sum()，它给出了总和，有效地忽略了 rowwise()，对于 mean()，所有答案都是 NA，我对每一行都收到以下警告：

我还尝试通过包含 c() 函数进行此修改，就像您要列出每一列一样。这导致了以下错误：

如何使用 rowwise() 完成这项工作？为什么它的行为与典型的和 rowSums() 或 rowMeans() 如此不同？

我很感激任何见解！

r dplyr sum mean rowwise

2020-04-05T17:33:22.823

0 投票

1 回答

110 浏览

r - data.table：以列为输入对大型 data.table 执行高效的逐行操作

我有一个非常大的 data.table 1.6x10^8 行，我想在列exposure和之间执行逐行操作exposure.before.index，如下面的示例所示。

我创建了 TI 列（即治疗强化），它指示一个非 ID 当前是否在一种/多种药物上exposure，这与它们在每个 ID 各自的第一行所使用的任何药物都不同exposure.before.index。您可以查看我的代码并观察最终输出是否如说明的那样。

我创建 CNT 是为了在和any(!unlist(strsplit(exposure, "[+]"))%in%unlist(strsplit(exposure.before.index, "[+]")))之间应用我的函数。由于我使用此方法的 1.6x10^8 行需要相当长的时间。当我想逐行应用某个操作/函数时，我通常会使用这种 data.table[...,by="CNT"] 技术，但我发现这对于非常大的 data.table 来说并不可靠。你们中的一些人还有其他方法比我的方法更强大吗？exposureexposure.before.index

我发现了与我的主题类似的其他问题，但答案并没有概括为以稳健的方式对用户定义的函数应用逐行操作。

任何帮助和/或建议表示赞赏。

r data.table robust rowwise

2020-04-06T18:37:04.467

0 投票

1 回答

26 浏览

r - 2 R 中数据框字段中的数值

我在 R 中有一个不到 100 列的数据集。

某些列具有与 90 相对的数值，例如 87+3。

我已经能够使用以下代码更新每一列：

但是，我希望能够以更有效的方式更新 60 列的列表，而不是简单地为每一列重复这一行。

有人可以帮我找到更有效的方法吗？

r dplyr rowwise

2020-04-09T19:48:03.483

0 投票

1 回答

81 浏览

r - 使用 dplyr 在 for 循环中进行逐行操作

我有一些传输数据，如果在 for 循环中进行比较，我想按行执行。数据看起来像这样。

结果将记录每个物种中花瓣宽度相等的萼片长度的实例。这样我们就记录了花瓣宽度相等的萼片长度对（这只是一个没有科学意义的说明）。这会产生这样的结果：

我最初的 Python-ish 想法是在 for 循环中执行 for 循环，看起来像这样：

我曾想过使用group_byto classification Speciesfirst 来实现第一个 for 循环for s in unique(Species):。但我不知道如何逐行比较数据集中的每个观察值，并像第二个代码块一样存储它。我在 dplyr和rowwise quantity中看到了有关 for 循环的问题。如果上面的代码不是很清楚，我很抱歉。第一次在这里提问。

r group-by dplyr rowwise

2020-04-22T12:56:49.997

0 投票

1 回答

63 浏览

r - 使用 dplyr 进行自适应范围的逐行操作

根据我之前的问题，我想在给定智能卡数据的情况下计算托管（即两个人同时出现）实例。这是一个由十条记录组成的虚构样本：

给定 30 分钟的托管缓冲区（即 07:24 到达的乘客 1 将在07:54之前到达时与另一位乘客一起托管），我想记录成对乘客满足此条件的所有实例，并记录boarding_stop, boarding_time,和他们的smartcard身份证。

例如，我会发现乘客 1 和 3C23位于 07:37:19。最终，我想要表单的输出

我之前的尝试是编写几个for循环来查找单独的旅行信息对，并确定两次旅行是否在半小时内记录在火车站。一旦找到，然后附加一个新行，其中包含有关时间、智能卡乘客和位置的信息。

我最初使用的方法dplyr是group_by首先对独特的电台进行分组。但是由于每对行程的半小时缓冲时间都在变化，我认为我不能简单mutate地summarise捕获colocation。我感谢@Matt 在之前的问题中的回答。对此的任何帮助将不胜感激。

r group-by dplyr rowwise

2020-04-25T05:23:25.807

0 投票

1 回答

347 浏览

r - dplyr `rowwise()` 是否以与 `group_by()` 组相同的方式分组？

我可以按变量对数据框进行分组，并确认它是否使用is_grouped_df()函数进行分组（如上所示）。

我可以对 dplyrrowwise()函数运行相同的分析，并且它似乎rowwise()没有按行对数据集进行分组。我有一个问题，并且阅读帮助页面 ( ?rowwise) 并不能清楚地回答我的问题。

按行分组输入

说明： rowwise() 允许您在数据帧上一次计算一行。当向量化函数不存在时，这是最有用的。

逐行 tibble 保持其逐行状态，直到被 group_by()、ungroup() 或 as_tibble() 显式删除。

我的问题：调用该rowwise()函数后，我是否需要ungroup()稍后在我的管道中调用该函数来取消分组我的数据集？或者这是默认完成的？以下管道表明包含rowwise()未分组的管道：

这句话让我感到困惑，“逐行小标题保持其逐行状态，直到被... ungroup()... 明确删除”。为什么我需要ungroup()一个已经取消分组的小标题？

r dplyr row grouping rowwise

2020-05-04T16:39:04.410

问题标签 [rowwise]

r - 使用 dplyr 和 rowwise 采样

r - 将 setdiff 结果存储在数据框单元格中

hashmap - 如何仅使用 Java 7 按特定列名逐行对 csv 数据进行分组

r - 如何在 R 中逐行比较两个不同的矩阵？

r - rowwise() 使用 mean() 和 sum() 产生错误

r - data.table：以列为输入对大型 data.table 执行高效的逐行操作

r - 2 R 中数据框字段中的数值

r - 使用 dplyr 在 for 循环中进行逐行操作

r - 使用 dplyr 进行自适应范围的逐行操作

r - dplyr `rowwise()` 是否以与 `group_by()` 组相同的方式分组？

问题标签 [rowwise]

Reference