1

我有两个数据框

df1=

   x  y1
0  0   0
1  1   1
2  2   2
3  4   3


df2=

     x  y2
0  0.0   0
1  0.5   1
2  1.5   2
3  3.0   3
4  4.0   4

我需要计算 y2-y1(对于相同的 x 值)(以便查看 2 个图表之间的差异)

如您所见,它们之间有些值是共同的……有些则不是

我想我需要重新采样我的数据......但我不知道怎么做!我需要对齐数据以便为 2 个数据框提供相同的“x”列。

在 2 点之间,应进行线性插值以获得给定 x 处的 y 值。

在这种情况下,使用 x_step=0.5 重新采样数据会很好

我做了这个...

import pandas as pd
import matplotlib.pylab as plt

df1 = pd.DataFrame([[0.0,0.0],[1.0,1.0],[2.0,2.0],[4.0,3.0]],columns=['x','y1'])
df2 = pd.DataFrame([[0.0,0.0],[0.5,1.9],[1.5,2.0],[3.0,3.0],[4.0,4.0]],columns=['x','y2'])

print(df1)
print("="*10)
print(df1['x'])
print("="*10)
print(df1['y1'])
print("="*10)

fig = plt.figure()

fig.subplots_adjust(bottom=0.1)
ax = fig.add_subplot(111)

plt.title("{y} = f({x})".format(x='x', y='y'))
p1, = plt.plot(df1['x'], df1['y1'], color='b', marker='.')
p2, = plt.plot(df2['x'], df2['y2'], color='r', marker='.')

plt.legend([p1, p2], ["y1", "y2"]) 

plt.show()
4

1 回答 1

1
import pandas as pd
import pylab as pl

df1 = pd.DataFrame([[0.0,0.0],[1.0,1.0],[2.0,2.0],[4.0,3.0]],columns=['x','y1'])
df2 = pd.DataFrame([[0.0,0.0],[0.5,1.9],[1.5,2.0],[3.0,3.0],[4.0,4.0]],columns=['x','y2'])
x = np.union1d(df1.x, df2.x)
y1 = np.interp(x, df1.x, df1.y1)
y2 = np.interp(x, df2.x, df2.y2)
pl.plot(x, y1, "-o")
pl.plot(x, y2, "-o")

在此处输入图像描述

于 2013-03-10T22:55:35.657 回答