问题标签 [rowwise]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
186 浏览

r - 用R找到矩阵中每一行的分位数的最快方法是什么?

我有一个 2×1000 矩阵,其每一列都是 (X,Y) 的一对观察值。我想找到每一行的相同分位数。说 q_0.05 和 q_0.95。计算它的最快方法是什么?

0 投票
0 回答
64 浏览

sql - 如何在 SQLite 中生成“行总和”列?

我正在尝试在 SQLite 中创建一个表,其中包含一个文本列、几个整数列和最后一列,该列是该行中所有整数的总和。

这是我的尝试:

错误信息是

非常感谢任何帮助,谢谢。

0 投票
2 回答
174 浏览

r - 在 R 中:逐行返回最大值和相应的列名

我试图在几列中逐行获取最大值,并使用最大值和相应的列名创建 2 个新列。然后,使用列名,我需要选择另一个列的值,该列共享该列名的子字符串。

这是我试图解决的一个例子:

这将是结果:

我发现了这个类似的问题,但无法完成我的任务。

对于每一行,返回最大值的列名

任何帮助是极大的赞赏。

0 投票
2 回答
74 浏览

python-3.x - 除了 pandas 和 dask 之外,还有哪些更快的读取大数据集和应用行明智操作的方法?

我正在编写一个代码,我需要根据大表的每一行填充一组数据结构。现在,我正在使用 pandas 来读取数据并进行一些基本的数据验证预处理。但是,当我进入流程的其余部分并将数据放入相应的数据结构中时,完成循环并填充我的数据结构需要相当长的时间。例如,在下面的代码中,我有一个包含 15 M 记录的表。表有三列,我基于每一行创建一个 foo() 对象并将其添加到列表中。

因此,在使用 pandas 将字符串日期转换为日期对象之后,我只需要遍历 DataFrame 来创建我的对象并将它们添加到列表中。这个过程非常耗时(在我的真实示例中,它甚至需要更多时间,因为我的数据结构更复杂并且我有更多列)。所以,我想知道在这种情况下提高我的运行时间的最佳做法是什么。我什至应该用它pandas来阅读我的大表并逐行处理它们吗?

0 投票
2 回答
251 浏览

r - R - 返回找到第一个给定值的行的列名

我试图在每个行值的数据框中找到第一次出现的 FALSE 。我的行是特定的事件,列是日期。我希望能够找到第一个 FALSE 的日期,以便我可以使用该值来查找返回日期。

我的数据框的示例结构:

我想以包含标识第一个 FALSE 实例的 ID 和列名的第二个数据框或列表结束。

例如 :

我不知道找到这种结果的机制。

实际的数据框包含几千行,所以很遗憾我不能手动完成。

我是新的 R 用户,所以请不要建议您可能期望更有经验的 R 用户已经考虑过的事情。

提前致谢

0 投票
3 回答
192 浏览

r - mutate & rowwise & grepl 的替代品

我正在研究如下所示的数据框,并希望计算 A 列中某些模式(“B”和“C”)的出现。

使用 rowwise、mutate 和 grepl 的代码确实有效,但使用 rowwise 非常慢。我想知道是否有任何替代方法来获得相同的结果?

结果:

0 投票
2 回答
671 浏览

r - R mutate & gsub 其中模式基于列

我正在尝试pattern删除var_1使用mutate()and gsub()

由于gsub()只需要一个字符串,我必须rowwise()mutate(). 否则它将只使用pattern列中的第一条记录。

我想知道是否有任何其他方法可以在不使用的情况下达到相同的结果,rowwise()因为它会大大减慢过程。

期望的结果:

0 投票
4 回答
436 浏览

r - R 编程,使用自定义脚本(针对每个 i)进行逐行数据帧计算以解决“桥牌游戏”

我有一个指定“桥牌游戏”的数据框(每一行都是一个独立的游戏),请参见下面的 4 个游戏的最小示例:

桥牌游戏如何运作? 全世界的考生都参加了桥牌比赛挑战,我们在数据框中收集了每场桥牌比赛的数据。每座桥都由编号的木板(不一定必须从 1 开始的正整数)和破碎板的“间隙”组成。候选人可以选择他从桥的哪一侧开始步行(升序 = 面板编号随着步行的进行而增加;或下降 = 面板的编号随着步行的进行而减少)。

可以在此处找到用于更好地理解桥牌游戏的图形(以数据框中的第一行为例): 单击此处

对于每个桥牌游戏(= 数据框中的行),我们有以下信息(= 列):

  • bridge_game$ start : 整块木板的所有起始位置(随机顺序)
  • bridge_game$ end : 整块木板的所有结束位置(随机顺序)
  • bridge_game$升序:以面板升序 (+) 或降序 (-) 的顺序穿过桥
  • bridge_game$ position : 候选人最终出现在指定的小组中

挑战是什么? 我需要编写一个脚本,我可以在整个数据帧上逐行运行以获得以下输出:

  • bridge_game$ desired_output : 测试候选人是否掉入河中(最终在一个破碎的面板上并被“取消资格”)。如果他没有被取消资格,我需要计算候选人步行所覆盖的整个木板的数量(破损的木板不算在内)。

重要的是,它应该适用于任何数量的整块木板

更准确地说,我将逐步说明所请求的 R 脚本应如何在下面运行:

0) 解决了

a) 将字符列表转换为 bridge_game$start 和 bridge_game$end 列的数字列表。

b) 计算i(整个木板的区域数;每行i1i=max)并对开始和结束位置进行排序以获得每个i的正确开始和结束值。

1)测试位置是否在损坏的面板上:end(i=1 to max-1) > position > start(i=2 to max) --> if TRUE for any of the test pairs --> "disqualified"

2)如果不是,测试给定位置位于整个面板的哪个区域(i = n): start(i=1 to max) <= position <= end(i=1 to max) --> if TRUE 回馈我 (= n)

3)

a) 应用此公式(如果方向为升序“+”且 n = 1):输出 = 位置 - 开始(i=1)+ 1

b) 应用此公式(如果方向为下降“-”且 n = i max):输出 = end(i=max) - position + 1

c) 应用这个公式(如果方向是升序“+”并且 n > 1):输出 = 位置 - 开始(i=1)+ 1 -(开始(i=2 到 n) - 结束(i=1 到 n- 1) - 1x[n-1])

d) 应用这个公式(如果方向是下降的“-”并且 n < i max):output = end(i=max) - position + 1 - (start(i=n+1 to max) - end(i=n到 max-1) - 1x[i=max - n])

我希望我在那里得到了数学。为了检查正确的输出,我在“bridge_game”数据框中创建了一个“desired_output”列。

谢谢你的帮助!

0 投票
2 回答
282 浏览

r - Tidyverse Rowwise 可能存在或不存在的列的总和

考虑以下小标题:

假设我想对“x”和“y”进行逐行求和,创建变量“z”,如下所示:

这对我想要的效果很好,但问题是我的真实数据集有很多变量,我不想在我有什么变量之前检查我没有什么。所以,假设我可能有总和元素中不存在的变量:

在这种情况下,它不会运行,因为列“w”不存在。我怎样才能让它运行,忽略“w”的不存在并对“x”和“y”求和?

PS:我更喜欢在运行总和之前不过滤数据集。无论变量是否存在,我都想以某种方式使总和发生。

0 投票
2 回答
141 浏览

r - R:在多个变量上计算逐行 lm()

如何计算存储在列中的 df 中多个变量的逐行 lm() / coeffs?

我有这种数据(只是例子):

trialNumber 代表我在一个试验中直接测量六个值的试验中的每一个。

我设法使用以下代码用带有箱线图的线性回归线绘制这些数据:

这导致了这个图表:

在此处输入图像描述

现在这是所有试验的线性回归线,但我希望将斜率(或回归系数)按行存储在变量“斜率”中。

最后我想要一个像这样的df:

我怎样才能做到这一点?我已经研究过这个apply功能,但我不知道如何使用它。

非常感谢您!