问题标签 [accelerate]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
ios - GRU Pytorch Keras 和 Wiki 中的 Formula 不同
我正在使用 cblas 库在 iOS 设备中实现 GRU。我使用了来自 Wiki 的 GRU 公式,以及我在 Coursera 上学习的 Wikipedia 中的相同公式。而且我发现在我的实现和 tf.Keras 中具有相同权重的结果是不同的。经过调试,我发现 Keras 和 Torch 中的 GRU 使用不同的公式计算 h_t:
接下来在wiki公式中:
h_t = (1 - z) * h_t_previous + z * h_tilda。
在 Keras 和 Torch 中时:
h_t = (1 - z) * h_tilda + z * h_t_previous。
有人可以解释为什么它们不同吗?从逻辑上讲,更新门乘以新值(我想从新值更新什么),不是吗?有趣的事实是,MPSGRUDescriptor 具有用于使用这两个公式处理此拐杖的 flipOutputGates 变量。
swift - 打印存储为 SparseMatrixStructure 的矩阵
我正在使用 Apple 的 Accelerate 框架,使用稀疏矩阵运算。
因此,我创建了一个稀疏矩阵:
我正在调用分解矩阵:
我真的需要检查分解的结果 - 即打印出结果。看不到任何获得结果的方法,更不用说打印出来了。
谁能帮我理解如何检索结果并打印出来?
python - 运行 numpy 时遇到问题 - 关于“错误加速后端”的错误?(python、vs 代码、OS X)
这里是非常新的python学习者。
尝试构建我的第一个项目,但 numpy 有很多问题。当我尝试运行该程序时,它会返回此错误:
我想我已经在 VS Code 上正确安装了所有东西,尽管弄清楚这一点也很头疼。
在谷歌搜索错误时,不断出现有关加速的内容,但我不知道如何删除或卸载它......甚至它是什么。
任何提示都会很有帮助!
如果需要更多信息,请告诉我。这是我在这里的第一个问题。
谢谢!:)
ios - 图像上的快速矢量化逐像素操作
我想使用均方误差测量两个灰度相同大小的图像之间的相似度。我不能使用任何不属于 macOS SDK 的框架(例如 OpenCV、Eigen)。没有向量化的这个算法的简单实现如下所示:
有没有办法以更矢量化的方式在没有循环的情况下做到这一点?也许是这样的:
swift - Swift - 创建高频正弦波
我有以下问题:为了调幅,我想生成一个给定频率的正弦波。对于较低频率(例如 440 Hz),该算法运行良好,但在处理高频(例如 20.000 Hz)时,我会得到额外的较低频率的噪音,随着时间的推移而增加 - 我的意思是我播放信号的时间越来越长,越来越多出现不需要的频率 - 因此信号失真。
这是我算法的精髓
如您所见,我使用循环 - 稍后页面数组用于生成对应的音调。
我确实测量了如下所示的执行时间:
当我们谈论 20.000 Hz 的信号频率时,执行时间应该不是问题,因为大约 0.0005 秒,一个信号周期或多或少适合执行时间范围的 10 次 -> 1 : 20.000 = 0.00005。
我的问题:我怎样才能获得纯信号?我应该使用指针吗?如果是这样,我该怎么做?
ios - Swift - 读取两个音频文件并计算它们的互相关
(我将其用作阅读文件参考,这是缺少实现的 Objective-C 线索,这是迄今为止我在 Objective-C 中看到的最接近的实现。)
我正在尝试获取一个互相关数组,该数组是根据 Swift Playgrounds 中的两个音频数组计算得出的。
我正在尝试执行的步骤(我在 Python 中轻松完成,使用scipy.signal.correlate)按以下顺序执行:
- 读取音频文件(作为两个浮点数组)和采样率(类似 Int)。如果它们是立体声,我只从两者中选择一个通道。
- 在较短数组的末尾附加一个零填充,因此两个数组的长度相同。这是一个必要的步骤。
- 使用Accelerate库并使用DSP 函数计算互相关。
- 在相关数组中找到与最高系数(或相关数组中的“峰值”值)相关的样本,并计算:
下面是我到目前为止所做的工作,但我被困在相关函数中。我不知道如何调用vDSP_conv或correlate。
就个人而言,我更喜欢vDSP_conv
,因为它与旧的 Apple 设备兼容,但实现一个工作脚本已经很好了。我什至不知道如何调用传递模拟数组的 vDSP 函数,更不用说从音频文件中获取的数组了。
此外,关于滑动信号的方向,卷积和相关之间存在概念上的差异。我不确定如何在vDSP_conv
函数中处理这个选项,我想我应该将__IF
参数传递为-1
.
我尝试使用以下方法实现相关性,而不是模拟数组:
但我在编译时收到以下错误:
无法将“UnsafeMutablePointer”类型的值转换为预期的参数类型“[Float]”
我也尝试过:
但我在运行时收到以下错误:
错误:执行被中断,原因:EXC_BAD_INSTRUCTION(代码=EXC_I386_INVOP,子代码=0x0)。
有了这个,我得到一个空数组:
c - 如何将 Accelerate Framework 链接到 MacOs 中的 ac 程序?
我刚开始使用 c 开发,我需要编译和链接一个使用 Apple Accelerate Framework 的程序: 简单示例accelerate.c
:
我用clang编译它:
并获得了一个新文件accelerate.o
我现在该怎么做才能正确链接它?我所知道的是这个Accelerate
框架位于/Library/Developer/CommandLineTools/SDKs/MacOSX.sdk/System/Library/Frameworks/Accelerate.framework
ps:如果我用 Xcode 运行这个程序,它会神奇地工作,但我需要从命令行执行它,我想知道我在做什么。
copy - qemu-img 在不同 ceph 集群之间转换 rbd 卷加速
有没有一种优雅的方法可以将 RBD 卷复制到另一个 Ceph 集群?
我使用 qemu-img 2.5 版本或 qemu-img 6.0 版本计算转换时间,方法是将卷(容量为 2.5T,仅使用 18G)复制到另一个 Ceph 集群。
测试qemu-img convert
结果:
qemu-img 2.5 在没有选项参数的情况下花费2 小时 40 分钟:
qemu-img 6.0使用选项参数(-m 16 -W -S 4k )花费3 小时 3 分钟:
问题:
1、为什么2.5版本写只用磁盘容量(18G),而6.0版本写洞盘2.5T?
2、如何使用qemu-img(2.5或6.0版本)加速将RBD卷转换到另一个Ceph集群或者有什么其他的办法?
ios - 如何将两个 vImage_Buffers 合并为一个 CVPixelBuffer
我有两个vImage_Buffers
,一个包含来自 CbCr8 源图像的数据,一个来自 Planar8 源图像。最初这只是CVPixelBuffer
iPhone 相机拍摄的一张 p8CbCr8 图像。我怎样才能将这两者vImage_Buffers
合二为一CVPixelBuffer
?
对于一架飞机,我知道我可以使用这种方法:CVPixelBufferCreateWithBytes(...)
,但是当我有多个飞机/数据时,我不确定该怎么做
ios - 尝试缩放 YUV CMSampleBuffer 并输出为 CVPixelBuffer
我CMSampleBuffer
收到了来自我的 iPhone 相机的信息。它是 1920x1080 像素,但我希望它是 1280x720 像素。我有以下代码来执行此操作:
这不会产生错误,但我的输出只是绿色。这里出了什么问题?