我的数据集中有两列。y 是因变量,具有三个级别(无序级别 A、B 和 C),x 是数字自变量。下面的示例说明了这种情况,但我的实际数据集更大,超过 1000 行。
+------+---+
| x | y |
+------+---+
| 5.93 | A |
| 4.46 | A |
| 4.63 | A |
| 5.07 | A |
| 5.71 | A |
| 6.81 | B |
| 6.45 | B |
| 6.07 | B |
| 7.26 | C |
| 8.24 | C |
| 6.25 | C |
| 7.34 | C |
| 7.17 | C |
+------+---+
我的零假设是 y 列中 A、B 和 C 的比例与 x 值无关。也就是说,与任何给定 x 值相关的 A、B 和 C 的比例都与 x 无关。另一种假设是这些比例取决于 x。
我正在为此寻找统计测试。
我想知道执行多项逻辑回归并评估系数的重要性是否是一种合理的方法,或者是否有更好的测试。