问题标签 [traminer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 如何在 R 中使用 seqIplot 配置 y 轴?
我正在尝试使用 R-package 配置序列索引图的 y 轴TraMineR
,我想出了如何为 y 轴设置全局限制,如果您想比较两个或多个之间的某些序列的数量,这将很有帮助分组,因为它均衡了规模。但我没有设法设置 y 轴刻度(如在 xtstep 中)。也许您可以使用以下示例代码快速帮助我:
默认的序列索引图如下所示,很难比较两组:
traminer - 序列回归树中的缩写
我使用序列回归树来检查职业轨迹的差异。在绘图和树的打印描述中,TraMineR 帮助菜单和 Matthias Studer 关于序列回归树/加权聚类的论文中都没有解释缩写。
您能否告诉我以下示例中的以下缩写是什么意思(15 年内 377 名参与者的等级提升的 d 图(30 期,每期 6 个月)?非常感谢!
打印输出
问题1:光盘=?(--> 在图中等于 s2,见下文)问题 2:[(1,20)-(2,8)-(3,2)] * = ? (这是最典型的序列吗?)
绘制的输出问题 3:s2 = ? (等于上面打印输出中的“光盘”)
r - 如何在 R 中使用 seqmtplot 配置 y 轴?
我正在努力使用 seqmtplot 定义绘图的 y 轴。我按照上一篇文章中描述的步骤(如何在 R 中使用 seqIplot 配置 y 轴?)。但是,它们似乎不适用于 seqmtplot。
我的绘图的 y 轴从 0 到 9,所以我希望它以 1 的间隔显示刻度线,即 0、1、2...9
我正在运行这些代码行。
这样做的问题是,我的绘图的 y 轴(即 0)的起点移动到显示数据的条形下方。
任何想法我该如何解决这个问题?
第二个相关问题是:如何访问 seqmtplot 生成的图的基础数据?
提前致谢。
traminer - 不等长度序列的可变插入缺失成本
我正在使用最佳匹配算法在 TraMineR 中进行序列分析。不幸的是,由于右删失数据,我的序列长度不等。我的序列的最小长度为 5,最大长度为 11。长度的变化对于我感兴趣的序列之间的差异没有意义。因此,我想将不等长度对序列之间的整体差异的影响保持为尽可能小。
我在 Stovel 和 Bolan (2004 (1)) 中读到了一个可能的解决方案,他们根据序列是否相等长度使用可变插入缺失成本。因此,对于等长的序列,他们使用固定的插入缺失成本,而对于不等的长度,他们使用降低的成本,“大约是固定成本的四分之一”。
我的问题是: 一般来说,应该如何在 TraMineR 中对缺失进行编码?作为无效元素还是我应该在字母表中包含缺失的状态?TraMineR 中是否有一个选项来应用可变插入删除成本,正如 Stovel 和 Bolan 所介绍的那样?如果是,如何做到这一点?
(1) 斯托维尔、凯瑟琳和马克·博兰。2004.“住宅轨迹:使用最佳对齐来揭示住宅流动性的结构。” 社会学方法与研究 32(4):559-598。
r - 从 TXT 文件加载数据并在 TraMineR 中转换为 TSE 格式
我在记事本文本文件中有数据。请帮我把TXT文件转换成TSE格式。
记事本中的文本数据:
日期、时间、用户、进程、活动
2013-06-25, 10:34:21.4375, uni15, 1, Index
2013-06-25, 10:35:13.0156, uni15, 1, ItemDetailsPartial
2013-06-25, 10 :35:54.9843, uni15, 1, CloseItemDetailsPartial
2013-06-25, 10:35:59.5781, uni15, 1, FilterByTag
2013-06-25, 10:36:05.9218, uni15, 1, ItemDetailsPartial
r - 格式化时间戳以避免 R/TraMineR 崩溃?
我有一个序列数据集,其中时间戳从纪元开始以秒为单位:
我想创建一个STS
序列对象:
但是,当我这样做时,RStudio 会崩溃,并且或多或少会冻结我的整个计算机。通过与其他运行良好的代码进行比较,这些代码在“时间”列中使用了个位数,我想我已经将问题确定为时间戳。会不会是 R/RStudio/TraMineR 只是因为长时间戳而过载?
r - 在单个序列对象中总结跨序列的属性?
我TraMineR
用来分析序列集。每个连贯的序列集可能包含来自单个项目的 100 个工作流程,用于单个时间段。使用TraMineR
我可以轻松计算每个序列的描述性统计数据,但是我对序列对象本身的描述性统计数据更感兴趣 - 包含其中的所有较小序列。
例如,为了获得状态频率,我运行:
但是,这给了我序列对象中每个序列的状态频率。我想访问我的序列对象内所有序列的状态频率。我怎样才能做到这一点?
r - 序列和 seqiplot 之间的不一致
我正在使用函数 seqiplot 创建序列索引图。问题是我在绘图上显示的内容与我的序列数据之间存在一些不一致。例如,我在周期 t 和 t+1 有相同的序列状态;但是,序列索引图显示每个时期的不同颜色。他们不应该有相同的颜色吗?
我怀疑这与我的数据集中可能的状态数量有关。有60个不同的州。因此,当我尝试设置配色方案时,我收到以下消息: In brewer.pal(60, "Accent") : n too large, allowed maximum for palette Accent is 8 Returning the palette you ask for that many colours
这表明 Accent 最多有 8 种颜色(不是吗?)。
有没有人遇到过类似的问题?我该如何解决?
问候,
弗朗西斯科。
traminer - 奇怪的子序列数?
我有一个这样创建的序列对象:
这给出了输出:
但是当我计算子序列时,我得到了看似荒谬的答案:
子序列的数量怎么会远远长于每个序列中的事件数量?
可以在此处找到数据集的“dput()” 。问题似乎是原始数据具有以秒为单位的时间戳。但是,我使用下面的函数将时间戳更改为简单的顺序:
这使得为熵、序列长度等创建适当的度量成为可能,但子序列的数量仍然存在问题。
r - 加速 TraMineR 命令
我有这种格式的数据(更长,但仍然缩写,数据集可以在这里找到):
加载了以下库:
我使用此功能(很快)加载它:
然后我运行这个函数来计算序列长度(非常慢):
然而,这是非常缓慢的。关于如何重构代码以加快速度的任何建议?
一些时间戳相距数千步,但每个序列只有几步长。不同序列的时间戳之间的大距离是否会导致计算时间长(在大学超级计算机上超过 20 小时)?