0

我需要为一个函数创建一个简单的包装器的快速 python 实现scipy.stats。这个函数只接受向量而不接受矩阵。下面的包装器是两个实现,但都具有相似的运行时间。是否可以在不将实现转移到 C/C++ 域的情况下加快其中的任何一个。

import numpy as np
from scipy.stats import kendalltau

def wrap1(X, y):
    corr = []
    p_value = []
    X = np.array(X).transpose()
    y = np.ravel(y)
    for col in X:
        ktau = kendalltau(col, y, nan_policy='raise')
        corr.append(ktau[0])
        p_value.append(ktau[1])
    return corr, p_value

##########Version2

def wrap2(X, y):
        X = np.array(X).transpose()
        y = np.tile(np.ravel(y), (X.shape[0], 1))
        corr, p_value = zip(*[kendalltau(a, b, nan_policy='raise')
                              for a, b in zip(X, y)])
        return corr, p_value

样品运行:

t1 = np.arange(30).reshape(10,3)
t2 = np.arange(10).reshape(10,)
wrap1(t1,t2)
wrap2(t1,t2)

非常感谢

4

1 回答 1

0

1) 在您的 wrap1 函数中,预先分配 corr 和 p_value 的数组,并填充它们而不是附加到列表中。

2)用 np.asarray(X) 替换 np.array(X) ---如果它已经是一个数组,这将避免制作 X 的副本。

如果停留在 python 级别,这可能是您可以轻松完成的所有工作。

如果这还不够,您可以尝试分析 kendalltau 函数。发生了很多事情,如果您发现花费大量时间检查数组的 nan 值,并且您确定您的输入没有这些,您可以将 scipy 实现的相关部分复制粘贴到您的代码。

于 2020-02-18T14:59:58.503 回答