我目前在更大的计算中嵌入了以下模式
seq1.isin(seq2[seq3].unique().compute().values)
哪里seq3
是一个布尔系列。性能似乎可以接受,但它很丑陋并且使用compute()
力评估,可能会消除并行性的机会。简单的说
seq1.isin(seq2[seq3].unique())
不起作用,文档说 to 的参数isin
必须是一个(我认为是 Numpy)数组。
有没有更好的方法来编写上述代码?如果seq1
和seq2
相同怎么办?
我目前在更大的计算中嵌入了以下模式
seq1.isin(seq2[seq3].unique().compute().values)
哪里seq3
是一个布尔系列。性能似乎可以接受,但它很丑陋并且使用compute()
力评估,可能会消除并行性的机会。简单的说
seq1.isin(seq2[seq3].unique())
不起作用,文档说 to 的参数isin
必须是一个(我认为是 Numpy)数组。
有没有更好的方法来编写上述代码?如果seq1
和seq2
相同怎么办?