0

假设 M 是一组对象 m,每个对象具有属性 X 和 Y。现在如果 X 和 Y 对于给定的 m 只能有一个值(即 X,Y 是随机变量,P(X=x_i|M=m_i),P( Y=y_i|M=m_i)),可以计算X和Y的互信息。但是如果X可以同时有多个结果呢?即 m_3 X={x1,x2} - 通常 X 的结果是所有可能结果的子集。在这种情况下,是否可以测量互信息或其他某种依赖度量?

是否可以将 X 拆分为二进制随机变量 X_1、X_2 等,其中 X_1=1 iff X 包含 x1,否则 X_1=0,然后为所有组合 i,j 计算 I(X_i,Y_j) 并按顺序汇总信息得到 I(X,Y)?

谢谢。

例子:

m_1: X={a,b}, Y={x,y}; m_2: X={c}, Y={z,x}
4

2 回答 2

0

根据集合的含义以及您想要使用互信息的目的,您可以将集合视为原子值。然后你的事件空间是 V_X 的幂集,你可以用通常的方式计算那个更大的事件空间上的互信息(想想位串)。

互信息有多种泛化,例如交互信息或总相关性,但我认为它们并不是您想要的。您最好查看其他非信息论的相关性多元测量。

于 2011-03-10T16:11:47.673 回答
0

如果我没记错的话,你设定的前提:

If M is a set of objects { m1, m2, ... },
and each mi has two attributes X, Y,
and X, Y can be a set of { x1, x2, ... } , { y1, y2, ... } respectively

那么你想定义

*(X, Y) based on each mi's X, Y

嗯,这在计算方面显着增加了问题的复杂性,但是您仍然可以进行相同类型的相关,除了不是关联两个值 X 和 Y,而是关联两个子集 X 和 Y。

于 2011-02-08T10:15:47.197 回答