问题标签 [traminer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 识别包含频繁子序列的序列索引
使用TraMineR
I 可以识别序列数据集中的频繁子序列。然而,它只给了我一个这样的子序列在整个数据集中出现的频率,例如它出现在 21/22 序列中的频率。
有什么方法可以准确地获取包含特定频繁子序列的序列的索引?
r - 在序列对象上使用 grep() 或 sub()?
我想总结事件序列对象中的某些模式。我想这样做的原因是我的序列太长(几百个事件),这使得计算变得非常困难。我已经确定了频繁子序列,现在我想用表示完整子序列的标记替换某些频繁子序列(就好像它是单个事件一样)。
例如,我可能有一个想要替换的模式,比如 FA-FA。在序列中
现在是:
我尝试了一些类似的东西:
这似乎工作正常,但是,它将序列转换为文本字符串,并且不再用作序列对象。有没有办法在保持序列对象作为序列对象的状态的同时进行此类替换操作?
r - 当 dput() 不起作用时该怎么办?
我通常用于dput()
a) 保存 R 对象,以及 b) 了解它们的内部结构。但是,在 TraMineR 包中,我遇到了以前从未见过的东西:
这返回:
这是什么意思?内部结构不可见吗?
traminer - TraMineR:seqici 为相同的序列提供不同的结果
我想知道 seqici() 是否取决于上下文?我有一个序列,我计算复杂度 seqici(mySeq)。我在一组序列中有相同的序列,我计算复杂度并具有不同的值。有人可以帮助知道会发生什么吗?
谢谢,
r - 绘制事件序列/事件序列聚类
也许这是一个非常无聊的问题,但我对此进行了研究,但找不到答案。
我想以与使用seqIplot
、seqfplot
和绘制状态序列相同的方式绘制我的事件序列。一般来说。seqdplot
seqmtplot
seqplot
当我尝试这样做时,我收到消息:
让我相信这些功能只适用于状态序列。
在用户指南第 10 节中,他们只给出了子序列图的示例。但那些并不完全相同。
1)有没有办法为事件序列生成上述图?其中状态将是过渡。
此外,当我尝试计算距离矩阵时,我得到一个类似的错误:
2)是否可以计算距离矩阵,然后将聚类方法应用于事件序列?
谢谢 !
sequence - 引导自己构建的函数 pvclust 不起作用
我正在使用序列分析方法来测量不同“空间使用序列”之间的相似性,表示为字符串。这是一个针对两个序列的三个类别(A:城市,B:农业,C:山)的理论示例:
我们用来衡量序列之间相似性的距离度量是汉明距离(即衡量序列中的一个字符需要被替换的频率以使序列相等,在上面的示例中,需要替换4 个字符使序列相等)。根据我们在计算汉明距离后获得的距离矩阵(给出每对可能的序列的距离或相异性),使用 Ward 的聚类方法(ward.D2)创建了一个树状图。
现在我还想包括一个很好的集群稳健性度量,以便识别相关集群。为此,我尝试使用 pvclust ,它包含多种计算引导值的方法,但仅限于一些距离度量。在未发布的 pvclust 版本中,我尝试实现正确的距离度量(即汉明距离),并尝试创建自举树。脚本正在运行,但结果不正确。使用 1000 的 nboot 应用于我的数据集,“bp”值接近 0,所有其他值“au”、“se.au”、“se.bp”、“v”、“c”、“pchi”为 0,表明这些集群是人工制品。
这里我提供一个示例脚本:
数据涉及非常同质的模拟序列(例如,继续使用 1 个特定状态),因此每个集群肯定是重要的。我将靴子的数量限制为只有 10 个以限制计算时间。
为了做这个分析,我使用了 R 包 pvclust 的未发布版本,它允许使用你自己的距离方法(在这种情况下:汉明)。有人知道如何解决这个问题吗?
r - 从 TXT 加载频繁子序列
是否可以从 .txt 文件中加载频繁子序列的列表,并使 TraMineR 将其识别为序列对象?
不幸的是,我没有原始数据,因此我无法重新创建分析。我拥有的唯一文件是一个包含频繁子序列的 .txt 文件。我假设它是使用seqefsub()
TraMineR 包中的函数创建的,带有maxGap=2
, 因为数据看起来像是上述函数的输出。
read.table()
将其作为数据框读取,但据我了解,TraMineR 将事件序列处理为具有许多附加属性的列表,例如,这些属性不包含在此文件中。或者我不知道如何提取它们...
这是 .txt 文件中的几行的样子:
r - 使用 TraMiner 显示单个集群的频率表
我目前正在使用 TraMiner 进行聚类练习。我有一个频率表,df.seq
我使用以下代码将其分成四个集群:
然后,我绘制了我的四个集群的序列频率图。
虽然seqfplot
提供了良好的视觉效果,但我希望看到每个单独集群的频率表。例如,我可以这样做:
并获得以下输出:
Sequence Frequency %
Item #1 10 30%
Item #2 9 25%
Item #3 8 20%
任何帮助将不胜感激!
r - 使用 TraMineR 中的组从 seqrep 中提取单个代表性序列图
我正在尝试重现seqrep
使用中的group=
选项制作的图,TraMineR
因为我想要一个图像文件,其中包含每个组的代表性序列以在演示文稿中使用。似乎我在语法中遗漏了一个重要部分,因为对序列对象进行子集化会产生group
与TraMineR
. 正如您在下面的图片中看到的那样,由不同标识的代表性序列seqrep
差异很大。你知道我的语法中缺少或错误的部分吗?
四组代表序列:见第二组
第二组代表序列
survival-analysis - 如何将 CoxPH 模型的 PPER 格式转换为 SPELL 格式
CoxPH 生存分析
我有一个 PPER(人期)格式的数据集,例如:
Machine_id,Timestamp,Event,TDV1,TDV2,TDV3,TDV4 TDV1/2 是因素(品牌、位置) TDV3/4 是连续的(温度、湿度)
需要转换为 SPELL 格式,例如:Machine_id,start.time,stop.time,event,TDV1,TDV2,TDV3,TDV4
我能够通过在 TraMineRextras 中使用 seqdef() 和 toPersonPeriod() 从 SPELL 转换为 PPER
需要帮助来做相反的事情。从 PPER 转换为 SPELL 格式时如何处理连续变量?