问题标签 [parakeet]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
927 浏览

python - 将函数转换为 NumbaPro CUDA

我正在比较几个 Python 模块/扩展或方法以实现以下目标:

此函数是有限差分时域 (FDTD) 方法的一个非常基本的实现。我已经通过几种方式实现了这个功能:

  • 有更多 NumPy 例程
  • 在赛通
  • 使用 Numba(自动)jit。

现在我想将性能与 NumbaPro CUDA 进行比较。

这是我第一次为 CUDA 编写代码,我想出了下面的代码。

不幸的是,我收到以下错误:

我也使用了 grid.to_host() ,但这也不起作用。CUDA 肯定在这个系统上使用 NumbaPro。

0 投票
1 回答
357 浏览

python - 使用 Parakeet 优化 Python 函数

我需要优化这个函数,因为我试图让我的 OpenGL 模拟运行得更快。我想使用Parakeet,但我不太明白我需要以什么方式修改下面的代码才能这样做。你能看出我应该怎么做吗?

据我所知,Parakeet 应该能够不加修改地使用上述函数——它只使用 Numpy 和数学。但是,从 Parakeet jit 包装器调用函数时,我总是会收到以下错误:

0 投票
1 回答
1493 浏览

python - 长尾小鹦鹉与 Numba 有何不同?因为我没有看到一些 NumPy 表达式有任何改进

我想知道是否有人知道鹦鹉和 Numba jit 之间的一些主要区别?我很好奇,因为我将 Numexpr 与 Numba 和 parakeet 进行比较,并且对于这个特定的表达式(我希望在 Numexpr 上表现得非常好,因为它是其文档中提到的那个)

所以结果是

在此处输入图像描述

以及我测试的功能(通过 timeit - 每个功能至少 3 次重复和 10 次循环)

如果您想在您的机器上仔细检查结果,您也可以使用IPython nb 。

如果有人想知道 Numba 是否安装正确......我想是的,它在我之前的基准测试中按预期执行:

在此处输入图像描述

0 投票
3 回答
542 浏览

python - 简化语句 '.'.join(string.split('.')[0:3] )

我习惯用 C/C++ 编写代码,当我看到以下数组操作时,我觉得有些 CPU 浪费:

因此我想知道:

  • 这条线是否会被执行(解释)为创建一个临时数组(内存分配),然后连接前三个单元格(再次分配内存)?
    还是 python 解释器足够聪明?
    (我也很好奇PythranParakeetNumbaCython和其他 python 解释器/编译器在这种情况下所做的优化......)

  • 是否有一个技巧可以编写更高效的 CPU 并且仍然可以理解/优雅的替换行?
    (您可以提供特定的 Python2 和/或 Python3 技巧和提示)