问题标签 [nvidia]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
3096 浏览

eclipse - 由于 OpenCL/CUDA 语法,如何关闭 Eclipse 中的错误/警告?

我使用 Eclipse 作为 OpenCL 的编辑器,并为*.cl文件打开语法高亮显示,使其表现得像 C++ 代码。它工作得很好,但我所有的代码都被强调为语法错误。有没有办法让我的语法突出显示并仅为我的*.cl文件关闭错误/警告?

0 投票
2 回答
5894 浏览

memory - OpenCL/CUDA 中每种内存访问类型有多少内存延迟周期?

我查看了编程指南和最佳实践指南,其中提到全局内存访问需要 400-600 个周期。我没有看到太多其他内存类型,如纹理缓存、常量缓存、共享内存。寄存器的内存延迟为 0。

如果所有线程在常量缓存中使用相同的地址,我认为常量缓存与寄存器相同。最坏的情况我不太确定。

只要没有银行冲突,共享内存就和寄存器一样?如果有,那么延迟如何展开?

纹理缓存呢?

0 投票
3 回答
789 浏览

cuda - 用于 MD5 加密的 Nvidia CUDA 或 ATI Stream?

当我看到一些我不知道的关于 ATI 的统计数据时,我正准备购买 Nvidia GTX 470。

ATI 卡上的流在执行加密和解密所需的数学运算方面是否更好?

0 投票
3 回答
1653 浏览

performance - 我应该创建多个 OpenCL 内核来避免条件语句吗?

在 OpenCL 中,我有一个需要对复杂和真实数据进行操作的内核。我可以在其中放置一个条件语句来调用正确的代码行来处理这个问题,或者我可以有两个我调用的内核并将条件语句推送到我的调用代码中。

这显然不利于可维护性,但对性能有重要意义吗?

0 投票
1 回答
959 浏览

graphics - 如何让 Windows Phone 7 模拟器使用硬件加速?

我在较旧的 MacBook Pro 上运行 Windows Phone 7 开发工具,配备 NVIDIA GeForce 9400M 显卡和 256MB 内存(不确定是否共享),我在模拟器上的动画中有很多卡顿,即使是简单的,所以我认为它没有使用我的图形硬件。帧率计数器始终为 002 或 003(和红色)。

根据Windows Phone 论坛上的这篇文章,这些是要求:

“需要具有 WDDM 1.1 驱动程序的支持 DirectX 10 的卡才能利用 Windows Phone Emulator 上的 GPU 加速功能用于 Silverlight® 应用程序”

从运行 DxDiag 开始,我的卡支持 DirectX 10 和 WDDM 1.1,我已经安装了从 create.msdn.com 下载的最新工具,以及来自 NVIDIA 的最新驱动程序。

这发生在全新安装的 Windows 7 上。

我能够运行一个空的 XNA Windows Phone 游戏而没有这里提到的错误消息,所以它可能毕竟使用了硬件加速,但普通的 Silverlight 东西真的很生涩。

我该怎么做才能让模拟器图形以不错的速度运行?

0 投票
1 回答
469 浏览

profiling - 对我的 OpenCL 内核(DSP 窗口函数)的分析结果感到困惑

我在 OpenCL 中完成了一个窗口函数内核。基本上,一个窗口函数只是将一组系数逐个应用于另一组数字(维基百科解释得更好)。在大多数情况下,我能够将窗口系数浮点数组填充到常量缓存中。

我希望 Compute Prof 的结果显示主机到设备和设备到主机的内存传输将占用 95% 以上的处理时间。对于我几乎所有的案例,它只占处理时间的 80%。我正在向电路板写入和读取一个 420 万浮点数组,并编写另一个通常保持在远低于 100 万的浮点数组。

内核中的任何内容看起来都很可疑吗?关于它是否应该首先在 GPU 上运行得比 CPU 更快的问题的任何意见(我仍然不是 100% 的)。我对为什么我的 gld_efficiency 和 gst_efficiency 徘徊在 0.1 和 0.2 之间感到有些惊讶。我制作这个内核时考虑到了 G80 全局内存合并。我的全局内存整体吞吐量在 40gbs 时似乎还不错。内核非常简单,发布在下面。

}

0 投票
1 回答
339 浏览

algorithm - 如何计算 CPU 中的计算成本与将数据发送到 GPU+执行计算+取回数据的成本?

如何计算 CPU 中的计算成本与将数据发送到 GPU+执行计算+取回数据的成本?

0 投票
1 回答
3887 浏览

cuda - 带有 VDPAU 的 GStreamer(使用 nVidia 卡的 h264 加速)

我使用最新版本的 gstreamer 插件不好,我想尝试 VDPAU。我用搅拌机基金会的大钱兔子电影进行测试。我试过这个命令: gst-launch-0.10 filesrc=/home/alex/big.mp4 ! mp4mux ! vdpauh264dec ! vdpauvideopostprocess ! vdpausink但它无法将 mp4mux 与 vdph264dec 链接。

我还尝试使用 ffdemux_mov_mp4_m4a_3gp_3g2_mj2 而不是 mp4mux 和 gst-launch 失败但出现错误消息:

如何使用 NVIDIA 卡的 VDPAU 功能播放 h264?

在此先感谢您的帮助,请原谅我的英语不好。

问候,

0 投票
2 回答
677 浏览

emacs - Emacs -fs(全屏)

我正在尝试以体面的字体在全屏模式下使用 emacs。我有一台运行 Ubuntu 的基于 nvidia 的笔记本电脑。首次加载时,字体很大,想想 16pt 字体。我使用菜单选项设置了体面的字体(8pt)。

现在,当我在全屏模式下运行 emacs 时,它会为大字体调整窗口类型,然后加载我的 8pt 字体。现在我屏幕的一半是小缓冲区。如何正确设置字体以便我可以使用全屏模式。

我尝试在我的 x 配置中指定 displaysize 并且 X 没有启动。我听说你需要为 nvidia 驱动程序做其他事情......但不确定它是如何工作的。

0 投票
1 回答
1971 浏览

opencl - 坚持为什么我的 OpenCL 内核不会使用特定参数执行

我有一个在 JOCL 中运行的 OpenCL 内核,它通过了我所有的 JUnit 测试。我将我的代码移植到 C++ 中,这样我就可以在相同的条件下分析内核。驱动程序在所有情况下都可以正常工作,除了一种。它在 JOCL 中运行得非常好,所以我相信我的 C++ 代码中的某些内容是错误的。我的代码在下面,我已经审计到死了。如果有人可以帮助我找出问题所在,我将不胜感激。

驱动程序代码适用于 args 1 和 2 作为 8192,arg 3 作为 512。它也适用于 args 1 和 2 作为 512 和 arg 3 作为 8192。Arg 4 始终只是 1,它将内核设置为实数。当我将 args 1 和 2 设置为 262144 并将 arg 3 设置为 16 时,它执行,没有错误报告,没有 seg 错误,但内核最终没有更改数据。请注意,在上述所有情况下,arg 1*3 都等于 2^22。我相信我在所有情况下都分配了相同数量的浮点数。我难住了。我无法让 OpenCL 告诉我出了什么问题 :(

}