问题标签 [traminer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Traminer seqtree 和 seqtreedisplay 的错误消息
我在 Mac 上使用新更新的 R 和 Traminer 来分析序列数据,并且无法让 seqtree 和 seqtreedisplay 运行回归树。使用 TraMineR 附带的 biofam 数据,R 给出了三个带有简单树和回归树的错误消息。
错误消息是
r - Traminer 中的多个事件
我正在尝试使用 TraMineR 一次分析多个序列。我已经查看了 seqdef,但我很难理解在处理多个变量时如何创建 TraMineR 数据集。我想我正在使用类似于 Aassve 等人使用的数据集的东西。(如教程中所述),每波都有关于几个状态的信息(例如,孩子、婚姻、就业)。我所有的变量都是二进制的。这是一个包含三个波(D、W2、W3)和三个变量的数据集示例。
我可能是错的,但我发现的材料一次只处理一个变量的数据管理和分析(例如,跨越几波的就业状况)。我的数据集比上面的要大得多,所以我不能真正手动估算这些,如本教程第 48 页所示。有没有人使用 TraMineR(或类似软件包)处理过此类数据?
1) 您如何将上述数据提供给 TraMineR?
2)你将如何计算替代成本,然后将它们聚类?
非常感谢
r - 如何使用 TraMineR 和聚合序列数据进行差异分析?
由于我有一个大数据集并且只有有限的计算资源,我想利用聚合序列对象使用R 包TraMineR
和WeightedCluster
. 但我很难找到这样做 的正确语法。
在下面的示例代码中,您会发现两个差异分析,差异分析的第一个树形图使用原始数据集,第二个使用聚合数据(即仅按频率加权的唯一序列)。
不幸的是,结果不匹配。你知道为什么吗?
示例代码
这个问题与大数据和序列距离的计算有关。
r - 使用 TraMineR 的平行坐标图 (seqpcplot):如何表示没有任何转换的事件序列?
我正在使用 R 包 TraMineR 来计算和分析事件状态序列。我的字母表由 7 个状态组成:但是,有些人在考虑的 84 个月内没有经历任何过渡,始终保持在同一状态。这些情况的事件状态序列例如是:
如果这些序列之一同时是最频繁的序列之一,那么命令 seqpcplot 如何表示它?它被简单地忽略了,因为序列中没有出现任何转换,并且这些图只显示了那些改变状态的最频繁的轨迹?
非常感谢。
r - seqistatd 命令是否计算每个状态所花费时间的标准误差?
我正在使用 R 包 TraMineR 来计算和分析事件状态序列。我的字母表由 7 个状态组成。我使用该seqistatd
命令计算了我感兴趣的一些亚群(例如具有不同教育水平的女性)在每个州花费的平均时间。但是,我想添加有关标准误差或在每个状态中花费的平均时间的标准偏差的信息。是否可以seqistatd
在行命令中做到这一点,还是我必须以某种方式自己计算估计?谢谢你。
r - TraMineR 序列中不同状态/事件的数量
我有兴趣计算我的数据集的每个序列中存在的不同状态的数量。为简单起见,我将使用 TraMineR 示例:
从这个序列开始:
1230 D-D-D-D-A-A-A-A-A-A-A-D
seqdss
然后使用以下函数计算提取的不同状态:1230 D-A-D
是否有一个函数可以提取序列中不同状态的总数,仅考虑状态的存在而不考虑其沿序列的潜在重复?换句话说,对于上述情况,我想获得一个包含此序列的值2
(事件A
和事件D
)而不是 3(1 事件A
+ 2 事件D
)的向量。
谢谢你。
r - Seqfplot:百分比与最频繁序列的数量?
我正在使用 R 包 TraMineR 来计算和分析状态序列。我想使用命令 seqfplot 获得序列频率图。但是,不是设置要绘制的最频繁序列的数量,而是使用
设置需要达到的最频繁序列的百分比(例如,样本的 50%)会很有用。我试过这个
但是 - 不同于seqrep.grp
和- 命令不支持seqrep
该选项。我应该创建一个新功能来做到这一点吗?trep
seqfplot
谢谢你。
r - TraMineR 的并行计算
我有一个包含超过 250,000 个观察值的大型数据集,我想使用该TraMineR
包进行分析。特别是,我想使用命令seqtree
和seqdist
,例如,当我使用 10,000 个观测值的子样本时,它可以正常工作。我的计算机可以管理的限制是大约 20,000 个观测值。
我想使用所有的观察结果,而且我确实可以使用一台能够做到这一点的超级计算机。但是,这并没有多大帮助,因为该过程仅在单个内核上运行。因此我的问题是,是否可以将并行计算技术应用于上述命令?还是有其他方法可以加快这个过程?任何帮助,将不胜感激!
r - 使用 seqrplot 命令输入新的轴刻度标签
我正在使用 R 包 TraMineR 来计算和分析状态序列。我正在尝试使用seqrplot
命令进行绘图并更改 x 轴刻度标签。代码将是,例如:
x 轴消失,但具有估算粗值的新轴出现在图的右下角某处。换句话说,它不会替换已删除的轴。有谁知道我做错了什么?谢谢