我将以下数据保存为 pandas dataframe
。有了这些数据,我想计算特定秒的买卖价差。但是,正如您所见,要价比出价多很多倍,反之亦然。所以我的目标是执行以下操作:我只想获取这样的数据,即它是一个出价,然后是一个要价,或者是一个要价,然后是相同时间戳的出价,然后计算点差以及有多少点差。
在下面的数据中,它看起来如下所示,我将取第 1 行和第 2 行,并计算为 0 的价差。然后我将取第 3 行和第 4 行的价差为 2。
time quote price volume
0 07:00:00 B 3950.5 5
1 07:00:00 B 3950.0 4
2 07:00:00 A 3950.0 7
3 07:00:00 B 3948.0 17
4 07:00:00 A 3950.0 20
5 07:00:00 A 3950.0 31
6 07:00:00 A 3950.0 44
7 07:00:00 A 3950.0 57
8 07:00:00 A 3950.0 67
9 07:00:00 A 3950.0 57
10 07:00:00 A 3950.0 67
11 07:00:00 A 3950.0 80
12 07:00:00 A 3950.0 90
13 07:00:00 A 3950.0 99
14 07:00:01 B 3948.0 15
15 07:00:01 A 3950.0 89
16 07:00:01 A 3949.5 1
17 07:00:02 A 3950.0 89
18 07:00:03 B 3948.0 12
19 07:00:03 A 3949.0 1
20 07:00:03 B 3948.0 9
21 07:00:03 B 3948.5 4
22 07:00:04 A 3949.5 5
23 07:00:04 B 3948.5 2
24 07:00:05 B 3948.5 1
这是我想要的输出:
time spread num_spread
07:00:00 2 2
07:00:01 2 1
07:00:03 1 1
07:00:04 1 1