问题标签 [rowwise]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
90 浏览

r - 使用 dplyr 和 rowwise 采样

这是我的例子:

不幸的是,我不知道如何让每个人都重现相同的示例,但这是我在计算机上得到的输出

df

第一行显示了这一点col_1并且col_2是不同的,而我希望它们是相同的。此外,我期望col_1col_2set_diff列中抽样。有人可以帮我澄清我的错误吗?

0 投票
1 回答
29 浏览

r - 将 setdiff 结果存储在数据框单元格中

这是我的例子:

它会产生一个错误:

出了什么问题以及如何解决?有什么想法吗?

更新:我的错,我只是忘了添加mutate

0 投票
0 回答
196 浏览

hashmap - 如何仅使用 Java 7 按特定列名逐行对 csv 数据进行分组

csv的格式是

第 1 行:c1、c2、c3、c4、c5

第 2 行:1、a、b、c、d

第 3 行:1、n、b、c、l

第 4 行:2、j、k、c、l

第 5 行:3、a、i、v、i

第 6 行:1、a、b、c、d

第 7 行:1、a、b、u、i

分组应该在 c1,c2,c3 列的基础上进行,如果这三个列的值都相同,则将其分组如下:

GROUP1:第 2 行和第 7 行相同,地图应为 Map(Map(String, String),Map(String, String))

即一个键{c1,1},{c2,a},{c3,b}(再次键值对)

具有多个值作为

{c4,c},{c5,d}(键值对)

{c4,u},{c5,i}(键值对)

GROUP2:第 3 行的列值不同,因此地图应为

键{c1,1}{c2,n}{c3,b}

值{c4,c}{c5,l}

第 7 行应添加到错误映射中,因为第 2 行与第 2 行相同

最终地图应该是 Map of(group.Num,Objects)

列名应从属性文件中选取,如下所示。

已经进行了多次试验,但 group by 仅由 8 支持,但特别是我需要使用 java 7。有人可以在这里帮助我吗?我需要更多的想法来克服这个

0 投票
1 回答
60 浏览

r - 如何在 R 中逐行比较两个不同的矩阵?

我有两个矩阵(mat1 和 mat2),具有相同的列数(每个 4 个)和不同的行数(一个矩阵有 3 个,另一个有 5 个)。我想将一个矩阵中的每一行与另一个矩阵中的每一行进行比较。行中的值和位置在两个矩阵中应该相同。我一直在尝试“应用”函数,但在定义函数时遇到了问题:apply(mat2,1,function(x){mat1[x,]==mat2 [x,]}其他类似的组合会导致消息“下标越界”。我在这个世界上很新(R 和编程),在网上有搜索信息,但我什么也没找到。我真的被困住了。非常感谢您的帮助。提前致谢。卡尔帕

0 投票
2 回答
138 浏览

r - rowwise() 使用 mean() 和 sum() 产生错误

我正在尝试获取跨行某些列的 mean() 和 sum()。此代码将生成数据集:

如果我尝试使用 rowSums() 或 rowMeans(),我会得到正确答案:

但是,如果尝试使用 rowwise() 后跟 sum() 或 mean(),它不起作用:

对于 sum(),它给出了总和,有效地忽略了 rowwise(),对于 mean(),所有答案都是 NA,我对每一行都收到以下警告:

我还尝试通过包含 c() 函数进行此修改,就像您要列出每一列一样。这导致了以下错误:

如何使用 rowwise() 完成这项工作?为什么它的行为与典型的和 rowSums() 或 rowMeans() 如此不同?

我很感激任何见解!

0 投票
1 回答
110 浏览

r - data.table:以列为输入对大型 data.table 执行高效的逐行操作

我有一个非常大的 data.table 1.6x10^8 行,我想在列exposure和之间执行逐行操作exposure.before.index,如下面的示例所示。

我创建了 TI 列(即治疗强化),它指示一个非 ID 当前是否在一种/多种药物上exposure,这与它们在每个 ID 各自的第一行所使用的任何药物都不同exposure.before.index。您可以查看我的代码并观察最终输出是否如说明的那样。

我创建 CNT 是为了在和any(!unlist(strsplit(exposure, "[+]"))%in%unlist(strsplit(exposure.before.index, "[+]")))之间应用我的函数。由于我使用此方法的 1.6x10^8 行需要相当长的时间。当我想逐行应用某个操作/函数时,我通常会使用这种 data.table[...,by="CNT"] 技术,但我发现这对于非常大的 data.table 来说并不可靠。你们中的一些人还有其他方法比我的方法更强大吗?exposureexposure.before.index

我发现了与我的主题类似的其他问题,但答案并没有概括为以稳健的方式对用户定义的函数应用逐行操作。

任何帮助和/或建议表示赞赏。

0 投票
1 回答
26 浏览

r - 2 R 中数据框字段中的数值

我在 R 中有一个不到 100 列的数据集。

某些列具有与 90 相对的数值,例如 87+3。

我已经能够使用以下代码更新每一列:

但是,我希望能够以更有效的方式更新 60 列的列表,而不是简单地为每一列重复这一行。

有人可以帮我找到更有效的方法吗?

0 投票
1 回答
81 浏览

r - 使用 dplyr 在 for 循环中进行逐行操作

我有一些传输数据,如果在 for 循环中进行比较,我想按行执行。数据看起来像这样。

结果将记录每个物种中花瓣宽度相等的萼片长度的实例。这样我们就记录了花瓣宽度相等的萼片长度对(这只是一个没有科学意义的说明)。这会产生这样的结果:

我最初的 Python-ish 想法是在 for 循环中执行 for 循环,看起来像这样:

我曾想过使用group_byto classification Speciesfirst 来实现第一个 for 循环for s in unique(Species):。但我不知道如何逐行比较数据集中的每个观察值,并像第二个代码块一样存储它。我在 dplyr和rowwise quantity中看到了有关for 循环的问题。如果上面的代码不是很清楚,我很抱歉。第一次在这里提问。

0 投票
1 回答
63 浏览

r - 使用 dplyr 进行自适应范围的逐行操作

根据我之前的问题,我想在给定智能卡数据的情况下计算托管(即两个人同时出现)实例。这是一个由十条记录组成的虚构样本:

给定 30 分钟的托管缓冲区(即 07:24 到达的乘客 1 将在07:54之前到达时与另一位乘客一起托管),我想记录成对乘客满足此条件的所有实例,并记录boarding_stop, boarding_time,和他们的smartcard身份证。

例如,我会发现乘客 1 和 3C23位于 07:37:19。最终,我想要表单的输出

我之前的尝试是编写几个for循环来查找单独的旅行信息对,并确定两次旅行是否在半小时内记录在火车站。一旦找到,然后附加一个新行,其中包含有关时间、智能卡乘客和位置的信息。

我最初使用的方法dplyrgroup_by首先对独特的电台进行分组。但是由于每对行程的半小时缓冲时间都在变化,我认为我不能简单mutatesummarise捕获colocation。我感谢@Matt 在之前的问题中的回答。对此的任何帮助将不胜感激。

0 投票
1 回答
347 浏览

r - dplyr `rowwise()` 是否以与 `group_by()` 组相同的方式分组?

我可以按变量对数据框进行分组,并确认它是否使用is_grouped_df()函数进行分组(如上所示)。

我可以对 dplyrrowwise()函数运行相同的分析,并且它似乎rowwise()没有按行对数据集进行分组。我有一个问题,并且阅读帮助页面 ( ?rowwise) 并不能清楚地回答我的问题。

按行分组输入

说明: rowwise() 允许您在数据帧上一次计算一行。当向量化函数不存在时,这是最有用的。

逐行 tibble 保持其逐行状态,直到被 group_by()、ungroup() 或 as_tibble() 显式删除。

我的问题:调用该rowwise()函数后,我是否需要ungroup()稍后在我的管道中调用该函数来取消分组我的数据集?或者这是默认完成的?以下管道表明包含rowwise()未分组的管道:

这句话让我感到困惑,“逐行小标题保持其逐行状态,直到被... ungroup()... 明确删除”。为什么我需要ungroup()一个已经取消分组的小标题?