为了找到 iris 数据集的两列之间的关系,我正在执行 kruskal.test 并且 p.value 显示了这两列之间的有意义的关系。
data(iris)
kruskal.test(iris$Petal.Length, iris$Sepal.Width)
结果如下:
Kruskal-Wallis rank sum test
data: iris$Petal.Length and iris$Sepal.Width
Kruskal-Wallis chi-squared = 41.827, df = 22, p-value = 0.00656
散点图也显示了某种关系。
plot(iris$Petal.Length, iris$Petal.Width)
为了找到这两个变量的有意义的边界,我运行了pairwise.wilcox.test
测试,但是为了使这个测试起作用,其中一个变量需要是分类的。如果我将两个连续变量都传递给它,那么结果将不符合预期。
pairwise.wilcox.test(x = iris$Petal.Length, g = iris$Petal.Width, p.adjust.method = "BH")
作为输出,我需要一个明确的切入点,这两个变量有某种关系以及这种关系在哪里结束(如上图红线所示)
我不确定是否有任何统计测试或其他编程技术来找到这些边界。
例如手动我可以做这样的事情来标记边界 -
setDT(iris)[, relationship := ifelse(Petal.Length > 3 & Sepal.Width < 3.5, 1, 0)]
但是,R 中有没有一种编程技术或库来找到这样的边界?
重要的是要注意我的实际数据是有偏差的。
谢谢, 索拉布