0

当我使用隔离森林时,它会返回具有较高和较低边界的异常值。隔离森林中是否有任何技术可以仅查找边界较低的异常值?

例如,在下面的代码中

from sklearn.ensemble import IsolationForest
X = [[1], [99], [100], [101], [102], [103], [104], [105], [106], [107], [1000]]
clf = IsolationForest(random_state=0)
clf.fit(X)
clf.predict(X)

输出是:

array([-1,  1,  1,  1,  1,  1,  1,  1,  1,  1, -1])

我们知道值 1 和 1000 是异常值,1 是下界,1000 是上界。有什么方法可以只找到具有较低边界的值吗?

例如上面的输出必须是这样的:

array([-1,  1,  1,  1,  1,  1,  1,  1,  1,  1, 1])
4

0 回答 0