3

假设我有两个很长的系列——大的和小的

index = pd.date_range(start='1952', periods=10**6, freq='s')
big = pd.Series(np.ones(len(index))*97, index)
small = pd.Series(np.ones(len(index))*2, index)

我想要实现的是创建一个新系列,它结合bigsmall,在它们的值之间交替,borders用于确定何时切换到另一个(例如,每 5 秒有一个边框)

borders = pd.date_range(start='1952', periods=len(index)/5.0, freq='5s')

是否有一个有效的基于矩阵的操作组合可以用来实现这一点?我尝试查看文档中的各种 join、merge 等运算符,但找不到任何提供类似逻辑的东西。

len()我可以使用 for 循环来实现这一点,但即使对于 10^5 的系列也会持续一分钟以上

alternating = pd.Series()
for i in range(1, 100, 2):
    b0 = borders[i-1]
    b1 = borders[i]
    b2 = borders[i+1]
    sec = pd.offsets.Second(1)
    alternating = alternating.append(small[b0:b1-sec]).append(big[b1:b2-sec])

的样本输出alternating.head(24)

1952-01-16 00:00:00     2
1952-01-16 00:00:01     2
1952-01-16 00:00:02     2
1952-01-16 00:00:03     2
1952-01-16 00:00:04     2
1952-01-16 00:00:05    97
1952-01-16 00:00:06    97
1952-01-16 00:00:07    97
1952-01-16 00:00:08    97
1952-01-16 00:00:09    97
1952-01-16 00:00:10     2
1952-01-16 00:00:11     2
1952-01-16 00:00:12     2
1952-01-16 00:00:13     2
1952-01-16 00:00:14     2
1952-01-16 00:00:15    97
1952-01-16 00:00:16    97
1952-01-16 00:00:17    97
1952-01-16 00:00:18    97
1952-01-16 00:00:19    97
1952-01-16 00:00:20     2
1952-01-16 00:00:21     2
1952-01-16 00:00:22     2
1952-01-16 00:00:23     2
4

1 回答 1

2

如果您的经期不到一分钟,您可以尝试以下方法:

index = pd.date_range(start='1952', periods=10**6, freq='s')
big = pd.Series(np.ones(len(index))*97, index)
small = pd.Series(np.ones(len(index))*2, index)

alternating = big[big.index.second % 10 >= 5].combine_first(small)

alternating然后看起来完全按照您的要求,并在 150 毫秒内计算。

于 2013-01-16T14:12:59.823 回答