“traminer”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

589 浏览

r - 使用 TraMineR 使用时间日记数据

我正在尝试使用 R 中的 TraMineR 使用时间日记数据（美国时间使用调查）进行序列分析。我将数据作为 SPELL 数据（id、开始时间、停止时间、事件），但在尝试时收到以下错误将其转换为 STS 或 SPS 数据：

as.matrix.data.frame(subset(data, , 2)) 中的错误：dims [product 0] 与对象 [9] 的长度不匹配

我相信这与我如何将时间（作为字符）转换为日期/时间类型有关。我相信 TraMineR 需要 POSIXlt 格式？

这是我的原始数据片段（trcode 是事件）

头（atus.act.short）

我使用 strptime 将字符串转换为 POSIXlt：

我还将 ID 减少到只有两位数

我最终得到一个新的数据框，如下所示：

然后我尝试创建一个序列对象[使用库（TraMineR）]

我收到以下错误：

as.matrix.data.frame(subset(data, , 2)) 中的错误：dims [product 0] 与对象 [9] 的长度不匹配

想法？

r traminer

2012-08-03T18:43:24.560

0 投票

3 回答

858 浏览

r - 使用 R 透视 CSV 文件

我有一个看起来像这样的文件：

我正在使用的数据集可以在https://github.com/aronlindberg/VOSS-Sequencing-Toolkit/blob/master/twitter_exploratory_analysis/twitter_events_mini.csv上访问。

我想为“repository_name”列中的每个条目创建一个表（例如bootstrap、hogan.js）。在该列中，我需要具有与该条目相对应的“类型”列中的数据（即，只有当前“类型”列中的行在当前“repository_name”列中也具有值“bootstrap”应属于新的“引导”列）。因此：

时间戳仅用于排序，不需要跨行同步（实际上它们可以删除，因为数据已经根据时间戳排序）
即使“IssuesEvent”重复 10 次，我也需要保留所有这些，因为我将使用 R 包 TraMineR 进行序列分析
列可以不等长
不同存储库的列之间没有关系（“repository_name”）

换句话说，我想要一个看起来像这样的表：

我怎样才能在 R 中做到这一点？

我使用 reshape 包的一些失败尝试可以在https://github.com/aronlindberg/VOSS-Sequencing-Toolkit/blob/master/twitter_exploratory_analysis/reshaping_bigqueries.R上找到。

r csv data-manipulation traminer

2012-08-08T21:14:22.630

0 投票

2 回答

179 浏览

google-bigquery - 如何从 BigQuery 中获取多个列？

我在 BigQuery 上查询 github 公共数据集。目前，我对所需内容的最佳查询如下所示。

这为我提供了来自该用户拥有的所有存储库（“repository_name”）的 repository_owner twitter（或任何其他用户）的所有事件（“type”），但在一个列中。

但是，我真正想要的是在列中包含所有事件（“类型”），每个存储库一列（“repository_name”），或多或少像这样：

时间戳（“created_at”）仅与排序机制相关。列不必等长，单行上的事件不必同时发生。

我将使用它来将事件放入 R 包 TraMineR 中进行序列分析。

我怎样才能做到这一点？

google-bigquery data-mining traminer

2012-08-09T02:24:24.987

0 投票

1 回答

2149 浏览

r - 以文本/表格格式显示 TraMineR (R) 树状图

我使用以下 R 代码生成带有基于 TraMineR 序列的标签的树状图（见附图）：

完整的代码（包括数据集）可以在这里找到。

与树状图以图形方式提供的信息一样，以文本和/或表格格式获取相同的信息会很方便。如果我调用对象 clusterward（由 agnes 创建）的任何方面，例如“order”或“merge”，我会使用数字而不是我从中获得的名称来标记所有内容colnames(twitter_sequences)。另外，我看不到如何输出在树状图中以图形方式表示的分组。

总结一下：如何获得文本/表格格式的集群输出，并使用 R 正确显示标签，理想情况下是使用 Traminer/集群库？

在此处输入图像描述