1

我对过渡成本矩阵有一个逻辑问题。我正在使用 R 包 Traminer 研究序列差异。

我试着给你一个简单的例子(非常简单,但我希望对解释我的问题有用):

有三个序列,我想计算相异矩阵。字母表是:H(健康)、I(在家生病)、IH(在医院生病)、D(去世)

我观察了 3 个受试者进行 5 次观察。这些是序列:

H – H – I – D – D 
H – I – I – I – D 
I – I – H – IH – IH 

替代成本矩阵是一个 4x4 表(状态 x 状态)。它必须是对称的?这是我的逻辑问题:虽然可以从状态 H、I 或 IH “过渡”到状态 Died,但相反是不合逻辑的。

我可以在 TraMineR 中使用非对称替代成本矩阵吗?

如果在我的数据库中,sm = "TRATE"从状态“I”到“D”的替换成本(例如用 计算)低于(0.5)从状态“I”到“IH”的替换成本(0.6),则 OM 算法用“D”代替“HI”代替“I”。

4

2 回答 2

2

转换率(估计的转换概率)不应与替代成本相混淆。替代成本应该反映州之间的差异。

转换率矩阵(由 返回seqtrate)不是对称的。

用于计算距离(例如最佳匹配距离)的替代成本必须是对称的。否则,结果将不是距离矩阵,并且将这样的非对称矩阵输入到例如聚类过程中会导致意想不到的结果。

从过渡率推导出替代成本只是定义替代成本的几种可能性中的一种。令 $p(i|j)$ 为从 $j$ 转移到 $i$ 的概率,它包括将替代成本定义为

$c(i,j) = 2 - p(i|j) - p(j|i)$

于 2015-02-18T15:01:51.740 回答
1

在我看来,您正在寻找自定义成本矩阵。不强制使用TRATEorCONSTANT方法。

要创建自定义矩阵,您只需执行以下操作:

myscm <- matrix(c(0,1,2, 
                  1,0,2, 
                  2,2,0), nrow=3, ncol=3) 
dist.om <- seqdist(my.seq, method="OM", sm=myscm)

myscm您的自定义矩阵在哪里

这取自http://lists.r-forge.r-project.org/pipermail/traminer-users/2011-July/000075.html

我相信你有两个选择:

1) 为所有转换和一个完整的自定义矩阵创建一个基本原理

2)获取您已经生成的转换矩阵(使用seqsubm(your.seq, method = "TRATE"))并仅更改不一致的值。这就是我在上次分析中所做的。

但请记住吉尔伯特在“不对称”成对距离矩阵中提出的观点

于 2015-02-20T12:55:06.383 回答