问题标签 [matrix-multiplication]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c - CUDA/C 矩阵乘法
有人可以告诉我我在这里做错了什么吗?我正在尝试创建一个使用 cuda 将矩阵返回到幂的程序。似乎 cudaMemcpy (ln103) 没有返回结果数组。我通过返回矩阵中的第一个元素来检查它,但我总是得到 0。也许我的内核有问题?将不胜感激任何帮助:
编辑:我应该澄清一下,内核被迭代(从矩阵乘以各自的单位矩阵开始,然后乘以之后的每个结果)直到 k 次,这使矩阵具有幂。
即A是一个矩阵A^0 = I(单位矩阵)A^k = A^(k-1)*A
输入 :
代码:
谢谢你的回复。现在,当我运行它时,我会在内核调用中得到一个带有以下输入的无限循环。还有新代码。我感谢您的帮助
新代码:
python - 在numpy中找到子数组的点积
在numpy中,该numpy.dot()
函数可用于计算两个二维数组的矩阵乘积。我有两个 3D 数组 X 和 Y (比如说) ,我想计算矩阵 Z Z[i] == numpy.dot(X[i], Y[i])
。i
这可以非迭代地做吗?
wolfram-mathematica - 三个矩阵的乘积最终是一个奇数块矩阵?
在以下数学代码中
d 的显示显示为二乘二矩阵,其中 1,1 和 2,2 元素本身是 2x2 矩阵,而我希望它是一个普通的旧 2x2 标量矩阵?
matlab - 在 Matlab 中创建和操作三维矩阵
我拼命地试图避免for
Matlab 中的循环,但我不知道该怎么做。情况如下:
我有两个m x n
矩阵A
和B
两个向量v
和w
长度d
。我想进行外乘A
,v
这样我就得到了一个m x n x d
矩阵,其中(i,j,k)
条目是,对于andA_(i,j) * v_k
也是类似的。B
w
之后,我想添加结果m x n x d
矩阵,然后mean
沿着最后一个维度取回一个m x n
矩阵。
我很确定我可以处理后一部分,但第一部分让我完全卡住了。我尝试使用bsxfun
无济于事。有人知道这样做的有效方法吗?非常感谢!
编辑:此修订版是在以下三个很好的答案之后进行的。毫无疑问,gnovice 对我提出的问题有最佳答案。但是,我要问的问题涉及在取平均值之前对每个条目进行平方。我最初忘记提及这部分。鉴于这种烦恼,其他两个答案都很好,但是这次在编码之前做代数的聪明技巧并没有帮助。谢谢大家的帮助!
opencl - 用于科学计算的 Cayman Architecture 中的本地数据存储与纹理缓存
我正在尝试在 ATI HD 6990 卡(Cayman 架构)上使用 AMD-APP-SDK 2.4 实现 GEMM 实现。
其中一种优化技术是使用分块/平铺。
在它的实现中,如果我们将子矩阵存储在共享的本地内存中会更快还是使用纹理缓存会更快?如果可能,请同时说明原因。
还请建议哪个更容易实施。
谢谢。
PS我只想要单精度,如果重要的话!
注意:子矩阵的大小不是问题,但是我觉得它越大越好。唯一需要考虑的因素是,如果内存单元是 128 位(4 个单精度),那么块大小应该是 4 的倍数。
matrix-multiplication - 如何将这threeCanvas.js 行代码转换为three.js?
无论出于何种原因,three.js 和 ThreeCanvas.js 是不兼容的。我正在尝试将 ThreeCanvas.js 程序更改为 three.js,但这条线给了我很大的问题:
问题是在three.js中既不存在“THREE.Object3D matrixRotation”也不存在“THREE.Matrix4 transform”,并且似乎没有不同名称下的等效方法。例如,有“THREE.Object3D matrixRotationWorld”,但代码完全不同。
有谁知道如何在three.js中重写它?
c# - C#:声明和使用 XNA 向量进行矩阵乘法等。人
我正在尝试在 C# 中声明和使用 XNA 向量进行矩阵乘法、求和等。
这些将用于图像处理,使其比常规的 SetPixel 和 GetPixel 更快。但是,我总是找不到有效的示例,并且我在网上尝试了很多示例,但似乎我遗漏了一些东西。
任何帮助和示例代码?
谢谢!
matrix - Erlang 矩阵库
我正在寻找一个强大的库来处理 Erlang 中的矩阵。没什么花哨的,只是有效地处理乘法和基本运算。我可以用列表等来做到这一点,但我确信我的实现不会很有效!
arrays - MATLAB:如何对两个矩阵数组进行向量乘法?
我有两个 3 维数组,前两个维度表示矩阵,最后一个维度通过参数空间计算,举个简单的例子
(但假设A(:,:,j)
每个都不同j
)。怎样才能轻松地执行j
两个这样的矩阵数组A
和的每矩阵乘法B
?
当然可以,但是如果第三维更像 1e3 元素,这将非常慢,因为它不使用 MATLAB 的矢量化。那么,有没有更快的方法呢?
c++ - 使用 SSE 加速浮点 5x5 矩阵 * 向量乘法
我需要每秒运行 240000 次矩阵向量乘法。矩阵是 5x5 并且始终相同,而向量在每次迭代时都会发生变化。数据类型是float
。我正在考虑使用一些 SSE(或类似)指令。
我担心算术运算的数量与所涉及的内存操作的数量相比太少了。你认为我能得到一些切实的(例如> 20%)改进吗?
我需要英特尔编译器吗?
你能指出一些参考资料吗?