问题标签 [vectorization]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
arrays - matlab矢量化变化数组
谁能告诉我关于行/列数在矩阵中改变行或列背后的基本思想是什么?我一直在尝试将给定矩阵中的所有列替换为
我知道错误在于尝试替换所有行的多个列,并且我已经看到了使用 repmat 的另一种更简单的方法,但我想知道是否有类似于上述方法的方法。谢谢。
matlab - Octave / Matlab:矢量化'=='运算符?
我可以使用“==”运算符和“find()”函数在向量“数据”中查找值的位置,即 45:
有没有办法在不使用循环的情况下对多个值执行相同的操作,即我想在一次调用中获得 [ 4 5 7 ]:
arrays - 使用哪个 haskell 数组实现?AKA 各有什么优缺点
我需要什么?[无序列表]
- 非常简单的并行化
- 支持地图,过滤器等。
- 高效执行基于数组的计算的能力,例如 A=B+C,有点像 matlab 数组。
- SIMD 代码的生成。我想这在不久的将来是不可能的,但是嘿,我可以问:)
- 对矩阵的支持至少应该存在,现在更高的维度是较低的优先级。
- 能够获得指向它的指针并从 C 指针创建一个。
- 来自其他库的支持。IE,绑定到流行的 C 数学包,i/o 到磁盘或图像(如果数组是 2D)
我看到了什么?
- haskell 平台中的数组包。这是有福的,可以并行
- 数据.向量。有循环融合,但没有在平台上,所以它的成熟度对我来说是未知的。
- repa 包,由 DPH 团队贡献,但现在不能与任何稳定的 ghc 一起使用。
- 对数组实现的支持水平有很多变化。例如,似乎没有一种简单的方法可以将 2D 矢量转储到图像文件中。IOW,haskell 社区显然还没有解决数组实现。
所以,请帮我选择。
EDIT A=B+C 指的是元素加法,而不是列表连接
cuda - CUDA 可以使用 SIMD 扩展吗?
我用谷歌搜索了一下,但现在我不清楚某些用 CUDA 编程的 GPU 是否可以利用或可以使用类似于 SSE SIMD 扩展的指令;例如,我们是否可以对两个浮点向量进行双精度求和,每个向量都有 4 个值。如果是这样,我想知道对于向量的前 4 个值中的每一个使用更轻的线程还是使用 SIMD 是否会更好。
optimization - 将具有条件的 per32 位元素的代码转换(矢量化)为 SSE2 SSE3
我想对 Core2 的代码进行矢量化。我认为,我可以使用 gcc 或 icc 的内在函数,并且允许使用 SSE、SSE2、SSE3、SSSE3 指令。
我的代码适用于 8 个 uint32_t 元素的数组,就像这样(这里只有热点):
加法相当容易,但我不知道如何进行条件减法。
另外,我没有使用 SSE2 进行手动矢量化的经验,所以请告诉我应该如何在这里定义所有类型。
arrays - MATLAB:同时附加到元胞数组的多个元素
我想在项目的循环中一次将一个项目附加到单元格数组的多个元素(要附加)。例如
的元素nodes
可能是任何数组类型。
有没有等效的方法,只依赖索引,而不是上面使用的相对更昂贵的闭包?
r - 将此 for 循环向量化:将函数应用于子索引?
有没有办法对以下内容进行矢量化?
基本上,我想应用于myfunction
vector 的各种子集x
。似乎这些apply
函数并不是为了处理这个问题而构建的。
matlab - 如何计算没有循环的矩阵的欧几里得长度?
似乎这个问题的答案应该很简单,但我很难过。我有一个 Nx3 矩阵的矩阵,其中第 2 列和第 3 列是第 n 项的 XY 和 Z 坐标。我想计算从原点到项目的距离。在非矢量化形式中,这很容易。
距离=规范([xyz]);
或者
距离 = sqrt(x^2+y^2+z^2);
但是,在矢量化形式中,它并不是那么简单。当您将矩阵传递给 norm 时,它不再返回欧几里得长度。
距离 = 范数(矩阵);% 不起作用
和
距离 = sqrt(x(:,1).*x(:,1)+y(:,2).*y(:,2)+z(:,3).*z(:,3)); %只是看起来很乱
有一个更好的方法吗?
matlab - 从 MATLAB 中的正则表达式匹配向量化变量创建
是否可以对下面的循环进行矢量化?
optimization - 向量化 C++ 代码以提高 STL 性能
我正在对使用 C++/Linux/GCC/Windows XP/英特尔编译器构建的应用程序中的几个大型 STL 向量容器中包含的值进行计算
通过更改对齐属性或使用英特尔库函数等来研究矢量化的优化机会是否值得 - 或者编译器会自动处理?