我有以下二维数据集。(X 和 Y) 都是连续随机变量。
Z = (X, y) = {(1, 7), (2, 15), (3, 24), (4, 25), (5, 29), (6, 32), (7, 34) , (8, 35), (9, 27), (10, 39)}
我想检测关于 y 变量值的异常值。y 变量的正常范围是 10-35。因此,上述数据集中的第一对和最后一对是异常值,其他是正常的巴黎。我想将变量 z = (x, y) 转换为异常值(第一对和最后一对)位于标准偏差 1 之外的概率/频率分布。谁能帮我解决这个问题。
PS:我尝试过不同的距离,例如欧几里德距离和马氏距离,但没有奏效。