问题标签 [data-manipulation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在列中拆分分隔字符串并作为新行插入
我有一个数据框如下:
每个字母表都是一个用逗号分隔的字符。我想在每个逗号上拆分 V2 并将拆分字符串作为新行插入。例如,所需的输出将是:
我试图先strsplit()
吐出 V2,然后将列表转换为数据框。它没有用。任何帮助将不胜感激。
r - 把长桌换成宽桌
假设我有一张像这样的长桌:
我想将长表更改为宽格式,以便 A 列和 B 列中的每个元素都是列的标题。每行应该是 1 或 0,指示元素是否存在。C 列和 D 列保持不变。所需的表是这样的:
r - 基于指标的条件总和
我有一个这样的数据框:
如何根据Ind
值对列进行求和?如果Ind==1
,从列求和A
,如果Ind==2
,从列求和B
。例如,前 4 行的输出应该是10+10+1+19=30
,其中第一个 10 在A
,第二个 10 在B
,第三个 1 在B
,第四个 19 在A
。
r - R中可扩展的结转以创建每日时间序列
我正在尝试根据当前仅定期观察到的内容创建每日时间序列数据集。我可以成功地为单个案例执行所需的操作,但无法确定如何扩展到整个数据集。例如:
这是对间隔单位的观察:
我想在开始和结束日期的整个范围内每天取每个单位并复制“状态”和“终止”(以及大型数据集中的 N 个其他协变量)上的值。为一张唱片做这件事......
第一行的观测值在 START 到 END 的范围内重复,并创建一个新向量:整个期间的每日时间序列。我想对第 2 行执行此操作,将其绑定到 D 等等,按 UNIT 分析。我用 na.locf 编写了一个 for 循环,但未能成功进行概括:
单一记录“解决方案”的明显问题是处理“终止”日期。就在使用 na.locf 之前,它失去了它的日期状态。
我希望有一种更好的方式来看待这个问题,而我只是因为无知而把自己埋在了复杂之中。
r - 在 R 中对多个数据帧进行排序并对其求和
我有 10 个数据框,每个数据框有 2 列,我将数据框称为 a、b、c、d、e、f、g、h、i 和 j。
每个数据帧中的第一列称为 s 用于序列,第二列称为 p 用于对应于每个序列的 p 值。s 列包含所有 10 个数据帧的相同序列,本质上唯一的区别在于 p 值。下面是数据框 a 的简短版本,它有 600,000 行。
我想按 p 值对每个数据帧进行排名,最小的 p 值应该得到 1 的等级,相等的 p 值应该得到相同的等级。每个最终数据帧应采用以下格式:
我用它来做一个:
r<-rank(a$p)
cbind(a$s,r)
但我对循环不是很熟悉,也不知道如何自动执行此操作。最终,我想要一个具有 s 列的最终文件,在下一列中是每个特定序列的所有数据帧中所有等级的等级总和。所以基本上是这样的:
请帮忙,谢谢!
sas - 通过引用外部文本文件对 SAS 中的数据集进行子集化
我正在使用来自 FDA 的数据集,其中包含对药物反应的数据。我正在尝试按药物名称对数据进行子集化。我有一个包含我感兴趣的药物名称的外部文本文件。我想创建一个包含我感兴趣的药物的数据子集。我的外部文本文件名为 SSRIFULL.txt,变量名为 DRUGNAME。我尝试了很多明显错误的事情
IE
数据 SSRIFULL2;
---- 设置 SSRIFULL;
---- 如果 Drugname ~= "P:\APPRENTICESHIP\SSRI_LIST.txt" 则删除;
跑;
我找不到任何关于这个问题的文献。我应该更多地研究关于 truncover 或 proc sql 的主题吗?文本文件包含约 20 种药物的列表。我也对某种类型的内联代码持开放态度,但出于某种原因,SAS 不喜欢这样......
数据 SSRIFULL2;
---设置SSRIFULL;
------IF (AGE >19) OR (AGE = .) 然后删除;
------If (DRUGNAME ~= 'clomipramine' OR 'fluvoxamine' or 'Paxil' or 'paroxetine' or 'Prozac'
------或“氟西汀”或“思瑞康”或“维布特林”或“安非他酮”或“左洛复”或“舍曲林”
------OR 'Zyban') 然后删除;
跑;
可能很明显,我对 SAS 没有太多经验,我只是想让这个数据集可用于此时的分析。感谢您提前提供任何帮助
r - 遍历列表中的序列对象?
我有一个包含 24 个TraMineR
序列对象的列表。现在我想计算每个序列对象的最佳匹配距离(仅在每个对象内)并将其存储在一个新列表中,现在由 24 个 OM 距离对象(距离矩阵)组成。
数据集可以在这里找到。
步骤 (1) 工作正常,但是当我进行到步骤 (2) 时,它告诉我:
这是很自然的,因为sequence_objects
不是序列对象,而是序列对象的列表。
如何将该seqsubm
函数应用于序列对象列表?
r - 基于字符向量值跨 R 中的多个数据帧进行子集化
我有 6 个数据框,每个数据框有 2 列,用于“id”和“value”以及不同的行数。它们被标记为 p1、p2....p6,看起来像这样
我现在有一个字符向量,其中包含所有 6 个数据集的名称相交,称为 id_ intersect:
我现在想创建一个新的数据框,它只有每个数据框中包含 id_intersect 的部分的子集,并保留每个数据框中相交 id 的值。
我真的坚持这一点,我对 R 很陌生,所以非常感谢任何帮助。谢谢。
matlab - 如何在 MatLab 中选择撞击矩形的随机线
我正在创建随机的起点和终点。我想绘制那些与放置在原点的矩形交叉/相交的图形。我发现我的代码漏掉了一些行,如图。在那之后,我想计算轨道是否击中了矩形。例如,轨道来自顶部并从右侧退出等。
我的代码是
任何想法都会受到欢迎!
r - R如何将列表的一部分转换为data.frame?
假设我有一个数据集作为列表对象。这是一种快速生成一些随机数据的方法:
数据将如下所示:
假设我想从每个列表中提取 y1、y2 和 y3 并形成如下所示的数据框:
我怎么能这样做?