我正在尝试内插/本地外推一些工资数据以填写数据集。
这是数据集和可用数据的图表:
experience salary
1: 1 21878.67
2: 2 23401.33
3: 3 23705.00
4: 4 24260.00
5: 5 25758.60
6: 6 26763.40
7: 7 27920.00
8: 8 28600.00
9: 9 28820.00
10: 10 32600.00
11: 12 30650.00
12: 14 32600.00
13: 15 32600.00
14: 16 37700.00
15: 17 33380.00
16: 20 36784.33
17: 23 35600.00
18: 25 33590.00
19: 30 32600.00
20: 31 33920.00
21: 35 32600.00
鉴于明显的非线性,我希望通过局部线性估计器进行插值和外推(我想填写 0 到 40 年的经验),所以我默认为lowess
,这给出了:
这在情节上很好,但是缺少原始数据——R 的绘图设备已经为我们填补了空白。我一直无法找到predict
此功能的方法,因为它似乎R
正在朝着 using 的方向发展loess
,据我所知,这是一种概括。
但是,当我使用具有标准方法的loess
(设置surface="direct"
为能够推断,如 中所述)时,拟合不太令人满意:?loess
predict
(有强有力的理论理由说工资应该不降低——这里有一些噪音/可能的错误测量驱动了 U 形)
而且我似乎无法摆弄任何参数来恢复由lowess
.
有什么建议吗?