“data-manipulation”的相关标签问题

0 投票

6 回答

103323 浏览

r - 在列中拆分分隔字符串并作为新行插入

我有一个数据框如下：

每个字母表都是一个用逗号分隔的字符。我想在每个逗号上拆分 V2 并将拆分字符串作为新行插入。例如，所需的输出将是：

我试图先strsplit()吐出 V2，然后将列表转换为数据框。它没有用。任何帮助将不胜感激。

2013-03-11T19:47:55.807

0 投票

1 回答

339 浏览

r - 把长桌换成宽桌

假设我有一张像这样的长桌：

我想将长表更改为宽格式，以便 A 列和 B 列中的每个元素都是列的标题。每行应该是 1 或 0，指示元素是否存在。C 列和 D 列保持不变。所需的表是这样的：

r data-manipulation

2013-03-15T20:59:14.190

0 投票

3 回答

7544 浏览

r - 基于指标的条件总和

我有一个这样的数据框：

如何根据Ind值对列进行求和？如果Ind==1，从列求和A，如果Ind==2，从列求和B。例如，前 4 行的输出应该是10+10+1+19=30，其中第一个 10 在A，第二个 10 在B，第三个 1 在B，第四个 19 在A。

r sum data-manipulation

2013-03-20T16:32:01.583

0 投票

1 回答

248 浏览

r - R中可扩展的结转以创建每日时间序列

我正在尝试根据当前仅定期观察到的内容创建每日时间序列数据集。我可以成功地为单个案例执行所需的操作，但无法确定如何扩展到整个数据集。例如：

这是对间隔单位的观察：

我想在开始和结束日期的整个范围内每天取每个单位并复制“状态”和“终止”（以及大型数据集中的 N 个其他协变量）上的值。为一张唱片做这件事......

第一行的观测值在 START 到 END 的范围内重复，并创建一个新向量：整个期间的每日时间序列。我想对第 2 行执行此操作，将其绑定到 D 等等，按 UNIT 分析。我用 na.locf 编写了一个 for 循环，但未能成功进行概括：

单一记录“解决方案”的明显问题是处理“终止”日期。就在使用 na.locf 之前，它失去了它的日期状态。

我希望有一种更好的方式来看待这个问题，而我只是因为无知而把自己埋在了复杂之中。

r bigdata zoo data-manipulation

2013-03-30T02:07:12.373

0 投票

2 回答

407 浏览

r - 在 R 中对多个数据帧进行排序并对其求和

我有 10 个数据框，每个数据框有 2 列，我将数据框称为 a、b、c、d、e、f、g、h、i 和 j。

每个数据帧中的第一列称为 s 用于序列，第二列称为 p 用于对应于每个序列的 p 值。s 列包含所有 10 个数据帧的相同序列，本质上唯一的区别在于 p 值。下面是数据框 a 的简短版本，它有 600,000 行。

我想按 p 值对每个数据帧进行排名，最小的 p 值应该得到 1 的等级，相等的 p 值应该得到相同的等级。每个最终数据帧应采用以下格式：

我用它来做一个：

r<-rank(a$p)

cbind(a$s,r)

但我对循环不是很熟悉，也不知道如何自动执行此操作。最终，我想要一个具有 s 列的最终文件，在下一列中是每个特定序列的所有数据帧中所有等级的等级总和。所以基本上是这样的：

请帮忙，谢谢！

r sum ranking data-manipulation

2013-03-30T21:26:35.690

0 投票

1 回答

177 浏览

sas - 通过引用外部文本文件对 SAS 中的数据集进行子集化

我正在使用来自 FDA 的数据集，其中包含对药物反应的数据。我正在尝试按药物名称对数据进行子集化。我有一个包含我感兴趣的药物名称的外部文本文件。我想创建一个包含我感兴趣的药物的数据子集。我的外部文本文件名为 SSRIFULL.txt，变量名为 DRUGNAME。我尝试了很多明显错误的事情

IE

数据 SSRIFULL2;

---- 设置 SSRIFULL;

---- 如果 Drugname ~= "P:\APPRENTICESHIP\SSRI_LIST.txt" 则删除；

跑;

我找不到任何关于这个问题的文献。我应该更多地研究关于 truncover 或 proc sql 的主题吗？文本文件包含约 20 种药物的列表。我也对某种类型的内联代码持开放态度，但出于某种原因，SAS 不喜欢这样......

数据 SSRIFULL2;

---设置SSRIFULL;

------IF (AGE >19) OR (AGE = .) 然后删除；

------If (DRUGNAME ~= 'clomipramine' OR 'fluvoxamine' or 'Paxil' or 'paroxetine' or 'Prozac'

------或“氟西汀”或“思瑞康”或“维布特林”或“安非他酮”或“左洛复”或“舍曲林”

------OR 'Zyban') 然后删除；

跑;

可能很明显，我对 SAS 没有太多经验，我只是想让这个数据集可用于此时的分析。感谢您提前提供任何帮助

sas subset data-manipulation

2013-04-02T23:15:42.187

0 投票

1 回答

1404 浏览

r - 遍历列表中的序列对象？

我有一个包含 24 个TraMineR序列对象的列表。现在我想计算每个序列对象的最佳匹配距离（仅在每个对象内）并将其存储在一个新列表中，现在由 24 个 OM 距离对象（距离矩阵）组成。

数据集可以在这里找到。

步骤 (1) 工作正常，但是当我进行到步骤 (2) 时，它告诉我：

这是很自然的，因为sequence_objects不是序列对象，而是序列对象的列表。

如何将该seqsubm函数应用于序列对象列表？

r data-manipulation traminer

histelheim

2013-04-05T16:05:05.530

0 投票

1 回答

498 浏览

r - 基于字符向量值跨 R 中的多个数据帧进行子集化

我有 6 个数据框，每个数据框有 2 列，用于“id”和“value”以及不同的行数。它们被标记为 p1、p2....p6，看起来像这样

我现在有一个字符向量，其中包含所有 6 个数据集的名称相交，称为 id_ intersect：

我现在想创建一个新的数据框，它只有每个数据框中包含 id_intersect 的部分的子集，并保留每个数据框中相交 id 的值。

我真的坚持这一点，我对 R 很陌生，所以非常感谢任何帮助。谢谢。

r data-manipulation

2013-04-05T18:00:32.170

0 投票

1 回答

113 浏览

matlab - 如何在 MatLab 中选择撞击矩形的随机线

我正在创建随机的起点和终点。我想绘制那些与放置在原点的矩形交叉/相交的图形。我发现我的代码漏掉了一些行，如图。在那之后，我想计算轨道是否击中了矩形。例如，轨道来自顶部并从右侧退出等。

我的代码是

任何想法都会受到欢迎！

matlab plot counter data-manipulation

2013-04-14T12:37:36.667

0 投票

2 回答

163 浏览

r - R如何将列表的一部分转换为data.frame？

假设我有一个数据集作为列表对象。这是一种快速生成一些随机数据的方法：

数据将如下所示：

假设我想从每个列表中提取 y1、y2 和 y3 并形成如下所示的数据框：

我怎么能这样做？

r plyr data-manipulation

2013-04-29T21:35:56.827

问题标签 [data-manipulation]

Reference