问题标签 [data-manipulation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
6 回答
103323 浏览

r - 在列中拆分分隔字符串并作为新行插入

我有一个数据框如下:

每个字母表都是一个用逗号分隔的字符。我想在每个逗号上拆分 V2 并将拆分字符串作为新行插入。例如,所需的输出将是:

我试图先strsplit()吐出 V2,然后将列表转换为数据框。它没有用。任何帮助将不胜感激。

0 投票
1 回答
339 浏览

r - 把长桌换成宽桌

假设我有一张像这样的长桌:

我想将长表更改为宽格式,以便 A 列和 B 列中的每个元素都是列的标题。每行应该是 1 或 0,指示元素是否存在。C 列和 D 列保持不变。所需的表是这样的:

0 投票
3 回答
7544 浏览

r - 基于指标的条件总和

我有一个这样的数据框:

如何根据Ind值对列进行求和?如果Ind==1,从列求和A,如果Ind==2,从列求和B。例如,前 4 行的输出应该是10+10+1+19=30,其中第一个 10 在A,第二个 10 在B,第三个 1 在B,第四个 19 在A

0 投票
1 回答
248 浏览

r - R中可扩展的结转以创建每日时间序列

我正在尝试根据当前仅定期观察到的内容创建每日时间序列数据集。我可以成功地为单个案例执行所需的操作,但无法确定如何扩展到整个数据集。例如:

这是对间隔单位的观察:

我想在开始和结束日期的整个范围内每天取每个单位并复制“状态”和“终止”(以及大型数据集中的 N 个其他协变量)上的值。为一张唱片做这件事......

第一行的观测值在 START 到 END 的范围内重复,并创建一个新向量:整个期间的每日时间序列。我想对第 2 行执行此操作,将其绑定到 D 等等,按 UNIT 分析。我用 na.locf 编写了一个 for 循环,但未能成功进行概括:

单一记录“解决方案”的明显问题是处理“终止”日期。就在使用 na.locf 之前,它失去了它的日期状态。

我希望有一种更好的方式来看待这个问题,而我只是因为无知而把自己埋在了复杂之中。

0 投票
2 回答
407 浏览

r - 在 R 中对多个数据帧进行排序并对其求和

我有 10 个数据框,每个数据框有 2 列,我将数据框称为 a、b、c、d、e、f、g、h、i 和 j。

每个数据帧中的第一列称为 s 用于序列,第二列称为 p 用于对应于每个序列的 p 值。s 列包含所有 10 个数据帧的相同序列,本质上唯一的区别在于 p 值。下面是数据框 a 的简短版本,它有 600,000 行。

我想按 p 值对每个数据帧进行排名,最小的 p 值应该得到 1 的等级,相等的 p 值应该得到相同的等级。每个最终数据帧应采用以下格式:

我用它来做一个:

r<-rank(a$p)

cbind(a$s,r)

但我对循环不是很熟悉,也不知道如何自动执行此操作。最终,我想要一个具有 s 列的最终文件,在下一列中是每个特定序列的所有数据帧中所有等级的等级总和。所以基本上是这样的:

请帮忙,谢谢!

0 投票
1 回答
177 浏览

sas - 通过引用外部文本文件对 SAS 中的数据集进行子集化

我正在使用来自 FDA 的数据集,其中包含对药物反应的数据。我正在尝试按药物名称对数据进行子集化。我有一个包含我感兴趣的药物名称的外部文本文件。我想创建一个包含我感兴趣的药物的数据子集。我的外部文本文件名为 SSRIFULL.txt,变量名为 DRUGNAME。我尝试了很多明显错误的事情

IE

数据 SSRIFULL2;

---- 设置 SSRIFULL;

---- 如果 Drugname ~= "P:\APPRENTICESHIP\SSRI_LIST.txt" 则删除;

跑;

我找不到任何关于这个问题的文献。我应该更多地研究关于 trunco​​ver 或 proc sql 的主题吗?文本文件包含约 20 种药物的列表。我也对某种类型的内联代码持开放态度,但出于某种原因,SAS 不喜欢这样......

数据 SSRIFULL2;

---设置SSRIFULL;

------IF (AGE >19) OR (AGE = .) 然后删除;

------If (DRUGNAME ~= 'clomipramine' OR 'fluvoxamine' or 'Paxil' or 'paroxetine' or 'Prozac'

------或“氟西汀”或“思瑞康”或“维布特林”或“安非他酮”或“左洛复”或“舍曲林”

------OR 'Zyban') 然后删除;

跑;

可能很明显,我对 SAS 没有太多经验,我只是想让这个数据集可用于此时的分析。感谢您提前提供任何帮助

0 投票
1 回答
1404 浏览

r - 遍历列表中的序列对象?

我有一个包含 24 个TraMineR序列对象的列表。现在我想计算每个序列对象的最佳匹配距离(仅在每个对象内)并将其存储在一个新列表中,现在由 24 个 OM 距离对象(距离矩阵)组成。

数据集可以在这里找到。

步骤 (1) 工作正常,但是当我进行到步骤 (2) 时,它告诉我:

这是很自然的,因为sequence_objects不是序列对象,而是序列对象的列表。

如何将该seqsubm函数应用于序列对象列表?

0 投票
1 回答
498 浏览

r - 基于字符向量值跨 R 中的多个数据帧进行子集化

我有 6 个数据框,每个数据框有 2 列,用于“id”和“value”以及不同的行数。它们被标记为 p1、p2....p6,看起来像这样

我现在有一个字符向量,其中包含所有 6 个数据集的名称相交,称为 id_ intersect:

我现在想创建一个新的数据框,它只有每个数据框中包含 id_intersect 的部分的子集,并保留每个数据框中相交 id 的值。

我真的坚持这一点,我对 R 很陌生,所以非常感谢任何帮助。谢谢。

0 投票
1 回答
113 浏览

matlab - 如何在 MatLab 中选择撞击矩形的随机线

我正在创建随机的起点和终点。我想绘制那些与放置在原点的矩形交叉/相交的图形。我发现我的代码漏掉了一些行,如图。在那之后,我想计算轨道是否击中了矩形。例如,轨道来自顶部并从右侧退出等。

我的代码是

任何想法都会受到欢迎!

0 投票
2 回答
163 浏览

r - R如何将列表的一部分转换为data.frame?

假设我有一个数据集作为列表对象。这是一种快速生成一些随机数据的方法:

数据将如下所示:

假设我想从每个列表中提取 y1、y2 和 y3 并形成如下所示的数据框:

我怎么能这样做?