假设我收集(在列表中)在特定时间段内(比如上午 11 点后的前 5 分钟)发生的所有交易,用于 n 个股票(为简单起见,我将 n=2 并稍后调整)。假设我们有坚定的 AAA 和坚定的 BBB(如果有帮助,liststocks=['AAA', 'BBB'])。该列表看起来像:
trades=[['AAA', '2011-01-03', '11:03:51', 21.5],['BBB', '2011-01-03','11:03:57', 31.5],
['AAA', '2011-01-03', '11:04:20', 21.55],
['BBB', '2011-01-03','11:04:19', 32.01], ['BBB', '2011-01-03','11:04:52', 31.7]]
即,股票 AAA 的 2 笔交易和股票 BBB 的 3 笔交易。选择每只股票的最后一笔交易会导致缺乏同步性问题。这个想法是选择每只股票的最后一笔交易并找到最早的交易(['AAA', '2011-01-03', '11:04:20', 21.55])。然后选择时间尽可能接近'11:04:20'的所有其他股票的交易,这将导致我们选择['BBB', '2011-01-03','11:04:19', 32.01 ]。输出应该是一个列表,如:
C=[['AAA', '2011-01-03', '11:04:20', 21.55],['BBB', '2011-01-03','11:04:19', 32.01]]
非常感谢!