1

我是 HMM 的新手,但我尝试使用 Jahmm 为 UCI 人类活动识别数据集构建代码。该数据集有 561 个特征,7352 行,还包括加速度计和陀螺仪的 xyz 惯性值,主要用于识别 6 种活动:步行、步行上楼、步行下楼、坐着、站立和躺着。数据已标准化 [-1,1],但未进行 z 缩放。我只能在缩放后得到不错的结果(R 中的 scale() 函数)。缩放后,我尝试了 PCA、90+% 的相关性和 mtry=8 的 randomForest 重要性度量以降低维度,但到目前为止,randomForest 是唯一似乎有效的方法,但结果仍然很低(80%) . 此外,有时,某些活动在 Jahmm 代码上运行时会给出 NaN 值。

根据我到目前为止所读到的关于 HMM 的内容,这些结果太低了。在使用上述降维技术之前我应该​​做更多的预处理吗?是否有与 HMM 兼容的特定降维技术?我过拟合了吗?还是我最好让它离散而不是连续?我真的必须为我的项目做活动识别和 HMM。我很高兴能从已经尝试过 Jahmm 和 R 进行连续 HMM 的人那里得到建议/反馈。如果有人可以建议一个使用对数概率的包/库,并在给定一组新的测试数据的情况下从拟合的 HMM 中发出维特比序列,那也很棒。

4

0 回答 0