问题标签 [sequence-analysis]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
265 浏览

r - TraMineR 使用权重

我还是新手TraMineR;因此,对于你们大多数人来说,我的问题可能非常简单。我正在使用我的数据绘制一些序列图,并希望查看带有调查权重和标称权重的结果。我能够将数据导入 R 并按原样使用数据运行序列图,但无法使用权​​重运行它。我已经包含了关于如何创建状态序列对象的语法(非常幼稚)和两个序列图示例。如何编写使用权重的语法?谢谢

数据文件: DISDATAC调查权重: WTSURVY ; 标称重量: NORMWEIGHTS

0 投票
2 回答
176 浏览

r - 如何从回归树中识别每个叶子中的序列?

使用 biofam 数据集

我可以拟合并显示回归树:

然后我可以识别叶子成员:

然而,这就是我感到困惑的地方。我怎么知道哪个叶子编号对应于图中的哪个叶子?该图似乎没有显示它,并且运行print(seqt)似乎也没有给出叶子编号。

我想要实现的是分离出每片叶子中的序列,以便我可以分别在每片叶子上运行描述。我怎样才能做到这一点?

0 投票
2 回答
864 浏览

r - seqinr dotplot - 改变轴

我必须数据集:seq1 和 seq2(DNA 序列)。我想做一个数据图,比较两个序列并在两个序列匹配的地方放置一个点。我可以使用 seqinr 的 dotplot 来完成此操作,但我无法在轴上列出序列,以便您查看哪些点匹配。本质上,我想用序列字母替换数字。

有没有办法做到这一点?也许通过ggplot2?

点图

这些是我的序列:

这就是我生成此图的方式:

0 投票
1 回答
90 浏览

r - Format of output for seqecmpgroup() function?

The seqecmpgroup() function returns a table that, among other things, include frequencies for each of the specified groups. However, when I run this it generates frequencies below 1 (e.g. 0.00035). Should I interpret these frequencies as percentages showing in how many of the groups that each subsequence occurs?

Below I've pasted an example output (the frequencies for each group are listed as "Freq.1", "Freq.2", etc.:

0 投票
1 回答
335 浏览

traminer - TraMineR:::seqerules 帮助页面?

有帮助页面TraMineR:::seqerules吗?我似乎在包裹里或网上都找不到它。缺少此帮助页面使输出有点难以解释。例如ConfLift列指定什么?下面是一个输出示例:

0 投票
1 回答
140 浏览

r - 如何解决无效元素压倒性分析?

我正在使用 对长度非常不同的序列数据进行一些分析TraMineR。最终发生的是%用于使序列同样长的空元素 ( ) 最终压倒了其他所有内容:

我怎样才能避免这种影响?

0 投票
2 回答
654 浏览

r - Traminer 替换成本

我对过渡成本矩阵有一个逻辑问题。我正在使用 R 包 Traminer 研究序列差异。

我试着给你一个简单的例子(非常简单,但我希望对解释我的问题有用):

有三个序列,我想计算相异矩阵。字母表是:H(健康)、I(在家生病)、IH(在医院生病)、D(去世)

我观察了 3 个受试者进行 5 次观察。这些是序列:

替代成本矩阵是一个 4x4 表(状态 x 状态)。它必须是对称的?这是我的逻辑问题:虽然可以从状态 H、I 或 IH “过渡”到状态 Died,但相反是不合逻辑的。

我可以在 TraMineR 中使用非对称替代成本矩阵吗?

如果在我的数据库中,sm = "TRATE"从状态“I”到“D”的替换成本(例如用 计算)低于(0.5)从状态“I”到“IH”的替换成本(0.6),则 OM 算法用“D”代替“HI”代替“I”。

0 投票
1 回答
55 浏览

regex - 使用正则表达式检测序列

想象一下,我在这样的列表中有多个字符串:

我想使用正则表达式来检测特定字符串,其中某个子字符串在另一个子字符串之前,但不一定直接在另一个子字符串之前。

例如,假设我们正在寻找FA前面的EX. 这需要1在列表中匹配。即使FAhas-1-I2-1-I2-1-I2-1-在其自身和 之间EXFA仍然出现在 之前EX,因此预期匹配。

如何定义一个通用的正则表达式,以这种方式识别某些子字符串出现在另一个子字符串之前的字符串?

0 投票
4 回答
838 浏览

algorithm - 连续序列数据中的模式

假设我有一个事件列表。例如A, D, T, H, U, A, B, F, H, ....

我需要的是找到完整序列中出现的频繁模式。在这个问题中,我们不能使用像先验或 fp 增长这样的传统算法,因为它们需要单独的项目集。而且,我不能把这个流分成更小的集合。

知道哪种算法对我有用吗?


编辑

例如,对于序列A, D, T, H, U, A, D, T, H, T, H, U, A, H, T, H和 with min_support = 2

频繁模式将是

0 投票
0 回答
944 浏览

r - 在 R 中使用 arulesSequence 包进行序列挖掘

我正在尝试学习序列挖掘,并以wikibooks中的以下代码为例。当示例显示它应该花费不到一秒时,cspade 函数已经花费了 30 多分钟来运行(并且仍在运行)。有谁知道为什么会发生这种情况?