问题标签 [traminer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
414 浏览

r - 如何识别每个簇内的序列?

使用作为一部分的 biofam 数据集TraMineR

我可以进行聚类分析:

然而,在这个过程中,来自 biofam.seq 的唯一 id 已被替换为从 1 到 N 的数字列表:

现在,我想知道每个簇内有哪些序列,以便我可以应用其他函数来获得每个簇内的平均长度、熵、子序列、相异度等。我需要做的是:

  1. 将旧 ID 映射到新 ID
  2. 将每个簇中的序列插入到单独的序列对象中
  3. 对每个新序列对象运行我想要的统计信息

我怎样才能完成上面列表中的 2 和 3?

0 投票
1 回答
1655 浏览

r - R中漂亮的树状图?

我的树状图非常丑陋,几乎无法阅读,通常看起来像这样:

在此处输入图像描述

我想要创建类似于以下内容的内容,即圆形树状图,其中可以仔细控制标签的大小,以便它们实际可见:

在此处输入图像描述

我怎样才能在 R 中做到这一点?

0 投票
2 回答
131 浏览

r - 基于多个标准 W/缺失数据定义法术

我正在尝试一些我认为在 R 中相当简单的东西,但是给我带来了比我讨价还价的更多的麻烦。我想使用 R 来定义基于多个标准的法术,同时忽略缺失的数据。然后,目标是使用该aggregate命令计算跨法术的工资平均值。我怀疑TraMineR包中提供的工具可以用来实现这一点,但我很难弄清楚如何。

例如,给定以下数据:

我想编写代码,根据就业状况、雇主、职业或行业的变化来定义咒语。此外,我想忽略缺失值。鉴于此,正确的代码应为“拼写”返回以下向量:

最终,我想使用法术向量来计算个人法术的平均工资。返回以下内容:

这是调试的数据。需要注意的是 newemp (newemployer) 变量与我提供的示例不同,如果值为 1,它应该只开始一个新的咒语。因此,newemp=1 的一系列 4 年不应该代表一个咒语,而是四个不同的咒语:

0 投票
1 回答
945 浏览

r - 确定基于序列(距离)的聚类的理想聚类数

我编写了这些函数来对基于序列的数据进行聚类:

然而,这里集群的数量是任意分配的。有什么方法可以证明一定数量的集群捕获的方差量(或某种类似的度量)在一定数量的集群上开始达到收益递减点?我正在想象类似于因子分析中的碎石图

0 投票
1 回答
210 浏览

r - TraMineR 排序索引图

我需要一些关于如何按状态对序列索引图进行排序的建议。换句话说,我希望看到在情节底部以某种状态开始(序列开始)的序列,而不是最频繁地相互存储单个序列。

这可能吗?

这是我的语法示例:

0 投票
1 回答
232 浏览

r - 序列数据,状态序列

我有一些关于序列数据或序列挖掘的问题。我想用 R 中的 Traminer 创建一个序列;我的数据是纵向的,我将使用状态序列。

这是一个例子:

我的问题是:

  1. 我应该使用状态序列中的哪些方法?
  2. 如果有多个,哪个最好?

如果您有任何想法、教程或文章要阅读,我会很高兴;任何形式的帮助或建议将不胜感激。

谢谢你。

0 投票
2 回答
183 浏览

r - 在 R 中显示差异分析树(使用 graphviz)

我正在 R 中进行差异分析,并且在使用 graphviz 显示树时遇到问题。我按照 Studer 等人 2011 年(在:Guillet 等人:知识发现和管理的进展)中的描述做了所有事情。我使用 disstree 命令构建名为 tree.lcp 的树,然后尝试使用 graphviz 显示它:

第一个命令没有问题,但第二个命令会出现以下错误消息:

找不到命令“点”。
错误消息:
1:命令 'C:\Windows\system32\cmd.exe /c dot -Tsvg -O hh.lcp.dot' 给出状态 1
2:在 shell("dot -Tsvg -O hh.lcp.dot" ) : 'dot -Tsvg -O hh.lcp.dot' 进程失败 - 错误代码 1

我想它与路径命令有关(请参阅GraphViz: Windows PATH not set with new installer, issue when calling from R)但我将 GraphViz 安装到 C:\Program Files (x86)\Graphviz2.36 我理解的是默认值。

任何想法,问题出在哪里?如果问题仍然是路径命令,我怎么能在 shell 命令中包含路径?

谢谢!卡塔琳娜

0 投票
1 回答
133 浏览

r - 使用 TraMineR 的 seqedplot:如何在一张图中绘制选定的危险曲线?

我正在使用 TraMineRextras,特别是我对该seqedplot功能感兴趣。

这里有一个例子:

而不是通过以下方式绘制所有曲线:

我只会sex使用以下ignore选项根据变量绘制选定的曲线:

如何在一个图表中而不是在两个单独的图表中绘制男性和女性选择的曲线?

先感谢您

0 投票
1 回答
141 浏览

time - TraMineR 中从月度到年度的数据

我现在使用 TraMineR 有一段时间了,我有一个关于更改序列时间粒度的问题。目前,我的序列按月对齐,但出于多种原因,我想将其更改为年。我想使用每年最长的咒语作为该特定年份的状态。换句话说,如果有人同居 4 个月,然后在 2000 年结婚并在另外 8 个月保持婚姻,我想将该人编码为 2000 年结婚。我想知道是否有简单的方法用 TraMineR 做到这一点。

提前致谢,

汤姆

0 投票
1 回答
251 浏览

r - 如何使用序列频率将第二个 y 轴添加到 seqfplot?

我正在与 TraMineR 合作对教育数据进行序列分析。我可以让 R 使用类似于以下的代码生成数据中最常见的 10 个序列的图:

但是,我还希望在图的右侧有每个序列的频率(在对象 actcal.freq 中)。例如,由上面的代码创建的图中的第一个序列代表 37.9% 的数据(如当前图所示)。根据seqtab,这是 757 个科目。我希望数字 757 出现在右侧 y 轴上(其他序列以此类推)。

这可能吗?我玩过axis(side=4, ...)但从未能够让它重现左 y 轴的间距。