我在做生物信息学,我们在 mRNA 上绘制小 RNA。我们有每个 mRNA 上蛋白质的映射坐标,我们计算蛋白质与 mRNA 结合的位置与小 RNA 结合的位点之间的相对距离。
我获得以下数据集:
dist eff
-69 3
-68 2
-67 1
-66 1
-60 1
-59 1
-58 1
-57 2
-56 1
-55 1
-54 1
-52 1
-50 2
-48 3
-47 1
-46 3
-45 1
-43 1
0 1
1 2
2 12
3 18
4 18
5 13
6 9
7 7
8 5
9 3
10 1
13 2
14 3
15 2
16 2
17 2
18 2
19 2
20 2
21 3
22 1
24 1
25 1
26 1
28 2
31 1
38 1
40 2
当我绘制数据时,我有 3 张图片:1 张在 3 -4 左右,另一张在 20 左右,最后一张在 -50 左右。
我尝试三次样条插值,但它对我的数据效果不佳。
我的想法是用高斯总和进行曲线拟合。例如,在我的情况下,在点 5,20 和 -50 处估计 3 条高斯曲线。
我该怎么做?
我查看了 scipy.optimize.curve_fit(),但我怎样才能以精确的间隔拟合曲线?如何将曲线添加到一条曲线?