r - 在 TraMineR::seqdist 中设置“tpow”和“expcost”参数

Question

实际上，我正在研究住院患者住院期间的路径。这些路径表示为状态序列（每个时间单位的当前医疗单元），我试图通过聚类算法找到典型的路径。

seqdist我通过使用R 包中的函数TraMineR和方法来创建距离矩阵"OMspell"。我已经阅读了 R 文档和相关文章，但我找不到如何设置参数tpow和expcost.

由于时间单位是一小时，我不希望任何微小的持续时间差异对聚类结果产生重大影响（例如，与医疗单位转移相反）。但我也不希望持续时间没有任何影响......

另外，是否有适当的方法来选择它们的值？还是我只是继续摸索一个好的配置？（我使用 Dunn、Davies-Bouldin 和 Silhouette 标准来比较层次聚类的结果，除了对结果聚类的医学意见）

score 0 · Accepted Answer

该参数tpow是一个指数系数，用于转换实际拼写长度（持续时间）。默认值为 1，其拼写长度按原样计算。使用tpow=0，您将忽略法术持续时间，而使用，tpow=0.5您将考虑法术长度的平方根。

该expcost参数是扩展成本，即将（转换后的）法术长度扩展一个单位的成本。换句话说，当将一个序列编辑到另一个序列时，必须将长度的咒语t1扩展到长度t2，这将花费expcost * |t2^tpow - t1^tpow|. 对于expcost=0处于相同状态的咒语（例如 AA 和 AAAAA），无论它们的长度如何，它们都是等效的。

例如，将tpow=.5法术长度从 1 增加到 2 比将法术长度从 3 增加到 4 的成本更高。如果您不想太重视法术长度的微小差异，请使用低expcost. 但是，请注意，这expcost适用于转换后的拼写长度，您可能需要在更改tpow值时对其进行调整。

r - 在 TraMineR::seqdist 中设置“tpow”和“expcost”参数

1 回答 1

Related

Reference