0

我正在寻找支持轴选项的 numpy.unique() 的 GPU CuPy 对应物。

我有一个 Cupy 2D 数组,我需要删除它的重复行。不幸的是, cupy.unique() 函数将数组展平并返回具有唯一值的一维数组。我正在寻找像 numpy.unique(arr, axis=0) 这样的函数来解决这个问题,但 CuPy 还不支持 (axis) 选项

x = cp.array([[1,2,3,4], [4,5,6,7], [1,2,3,4], [10,11,12,13]])
y = cp.unique(x)
y_r = np.unique(cp.asnumpy(x), axis=0)

print('The 2D array:\n', x)
print('Required:\n', y_r, 'But using CuPy')
print('The flattened unique array:\n', y)

print('Error producing line:', cp.unique(x, axis=0))

I expect a 2D array with unique rows but I get a 1D array with unique numbers instead. Any ideas about how to implement this with CuPy or numba?
4

1 回答 1

2

从 CuPy 版本开始8.0.0b2,该功能cupy.lexsort已正确实现。此函数可用作cupy.unique轴参数的解决方法(尽管可能不是最有效的)。

假设数组是 2D 的,并且您想沿轴 0 查找唯一元素(其他适当的转置/交换):

    ###################################
    # replacement for numpy.unique with option axis=0
    ###################################

    def cupy_unique_axis0(array):
        if len(array.shape) != 2:
            raise ValueError("Input array must be 2D.")
        sortarr     = array[cupy.lexsort(array.T[::-1])]
        mask        = cupy.empty(array.shape[0], dtype=cupy.bool_)
        mask[0]     = True
        mask[1:]    = cupy.any(sortarr[1:] != sortarr[:-1], axis=1)
        return sortarr[mask]

如果您也想实现 return_stuff 参数,请检查原始cupy.unique源代码(这是基于)。我自己不需要那些。

于 2020-05-29T13:30:18.263 回答