问题标签 [numba]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
361 浏览

python - 使用 Numba 时静音 LLVM IR 调试输出?

我想在我们的一个内部客户端库中使用 Numba,但是每次我的代码 JIT 时都会有一个 LLVM IR 代码的调试转储。Numba 或 LLVM 中是否有我可以更改的设置以使这些内容静音:http: //i.imgur.com/Vkankxe.png

谢谢你。

0 投票
1 回答
933 浏览

python - 如何使用 ndarray 参数和/或输出定义 numba 类?

我试过这个:

使用@numba.double[:](numba.double[:])方法装饰器会导致错误。

0 投票
5 回答
9496 浏览

performance - 加速python中的元素数组乘法

我一直在玩 numba 和 numexpr 试图加速一个简单的元素矩阵乘法。我一直没能得到更好的结果,它们基本上(速度方面)都相当于 numpys 乘法函数。有没有人在这方面有运气?我是否使用了 numba 和 numexpr 错误(我对此很陌生),或者这完全是一种尝试加快速度的坏方法。这是一个可重现的代码,在此先感谢您:

0 投票
0 回答
115 浏览

python - 使用 numbapro cuda 扩展的转换错误

我正在尝试在共享阵列上运行一个小设备内核函数:

当我尝试运行 cuda_test() 函数时,出现错误:

我不明白这个转换错误——据我所知,我实际上并没有在任何地方重铸数组——它被声明为一个 float32 共享数组,并且它被传递给一个接受 float32 数组的函数。我错过了什么?

0 投票
4 回答
757 浏览

python - Python:已知瓶颈的 JIT

有什么方法可以以某种方式使用 pypy 来编译一个函数而不是用于我的 python 程序的其余部分?

我有一个已知的瓶颈,我花费了 99% 的 CPU 时间(主要包含整数移位和 XOR),并在 Python 中尽可能多地对其进行了优化。除非绝对必要,否则我不想编写和维护 C 库。

现在我正在使用 Anaconda Python,它是带有一堆库的普通 python。我会使用 pypy,但我不想确保我的程序的所有其余部分都可以使用 pypy。

有没有办法只在一个 Python 函数上显式运行 JIT?


编辑:函数是 GF2 中的模乘步骤(伽罗瓦域)

https://bitbucket.org/jason_s/libgf2/src/a71a14a035468e703a7c24349be814419cdba2cb/src/libgf2/gf2.py?at=default

具体来说:

它需要为 bigints 工作,所以我不确定如何重写以与 Cython 兼容。

我刚刚尝试了 numba 的 @autojit,但它失败了,因为它不知道要使用什么变量类型并假设是小整数。我似乎不知道如何告诉它使用标准的 Python bigints。

0 投票
2 回答
1594 浏览

python - Numpy 切片速度慢?

嗨,我正在使用 numpy + numba 运行科学计算。我已经意识到 numpy 数组就地添加非常慢......与 matlab 相比

这是matlab代码:

这是numpy代码:

结果表明,numpy 代码比 matlab 慢 10 倍……这让我很困惑。

此外,当我将加法从 for 循环中拉出,并将单个矩阵加法与 numpy.add 进行比较时,numpy 和 matlab 的速度似乎相当。

我知道的一个因素是 matlab 使用 JIT for version>=2012a 来加速 for 循环,但我在 python 代码上尝试了 numba,它仍然没有加速。我认为这与 numba 根本没有触及 numpy.add 函数有关,因此性能根本没有改变。

我猜 matlab 为这种情况做了一些病态的缓存,因此它大大击败了 numpy。

关于如何加快 numpy 的任何建议?

0 投票
2 回答
6284 浏览

python - Numba 中的稀疏矩阵

我希望使用 Numba( http://numba.pydata.org/ )加速我的机器学习算法(用 Python 编写)。请注意,该算法将稀疏矩阵作为其输入数据。在我的纯 Python 实现中,我使用了来自 Scipy 的 csr_matrix 和相关类,但显然它与 Numba 的 JIT 编译器不兼容。

我还创建了自己的自定义类来实现稀疏矩阵(基本上是(索引,值)对列表的列表),但它又与 Numba 不兼容(即,我收到一些奇怪的错误消息说它不' t 识别扩展类型)

有没有一种替代的、简单的方法来实现稀疏矩阵,只使用与 Numba 兼容的 numpy(不求助于 SciPy)?任何示例代码将不胜感激。谢谢!

0 投票
1 回答
134 浏览

python - 使用 numba 在 int_s 数组中查找 numpy.int_

我正在使用 numba (0.10.2-5-gda3e2bb-dirty) 来加速我的代码。现在我正在尝试以下操作:

然而 numba 似乎被 in 命令窒息。如果我输入类似

一切都很好。但是使用 in 命令 numba 将无法编译。有什么想法吗?

顺便说一句:我正在运行 python 2.7 和

返回

提前致谢!

缺口

0 投票
1 回答
148 浏览

python - Numba 元组切片问题 - 整数除外

谁能帮我理解为什么下面使用 Numba 的代码会给我一个错误?我在文档中看不到任何解释为什么这不起作用的内容:http: //numba.pydata.org/numba-doc/dev/index.html

给出的错误是

版本是:

0 投票
2 回答
1573 浏览

python - 如何从 numba 结构类型创建结构?

我可以定义一个 numba 结构类型:

现在我有了类型,如何创建一个实际的结构?