Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有一个关于熵的解释的问题。对于我的数据集中的每个人,我都有一个 17 个字符(年)长的字符串/序列。我对在这个观察期内发生了多少变化特别感兴趣。
我正在考虑使用 R 的 TraMineR 包来计算序列内熵。我知道这可以归一化,因此最大熵变为 1(显然,最小值为 0)。我的问题是,是否有任何经验法则可以说明什么是高熵,什么是低熵(例如,在相关系数的情况下)。例如,0.4 是高值还是低值?
谢谢。
序列内熵强烈依赖于上下文。要确定一个特定序列的熵是高还是低,我建议将其与其他序列的熵或与平均内熵进行比较。
同样,将一组的平均序列内熵与其他组的平均熵进行比较。因此,您可以得出结论,例如,女性的职业熵比男性高。