0

我目前在更大的计算中嵌入了以下模式

seq1.isin(seq2[seq3].unique().compute().values)

哪里seq3是一个布尔系列。性能似乎可以接受,但它很丑陋并且使用compute()力评估,可能会消除并行性的机会。简单的说

seq1.isin(seq2[seq3].unique())

不起作用,文档说 to 的参数isin必须是一个(我认为是 Numpy)数组。

有没有更好的方法来编写上述代码?如果seq1seq2相同怎么办?

4

2 回答 2

0

我认为不可能进行增量集成员资格操作。为了得到正确的结果,你需要一个完全实现的集合来回答一个项目是否是它的成员的问题。

于 2016-03-17T23:31:41.227 回答
0

您可能可以使用内部连接来实现此操作。

于 2016-06-09T14:52:39.977 回答