问题标签 [nvidia]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
6 回答
27689 浏览

cuda - 分配给设备内存的 CUDA 全局(如 C 语言)动态数组

所以,我试图编写一些利用 Nvidia 的 CUDA 架构的代码。我注意到在设备之间进行复制确实会损害我的整体性能,所以现在我正在尝试将大量数据移动到设备上。

由于这些数据用于许多功能,我希望它是全球性的。是的,我可以传递指针,但我真的很想知道在这种情况下如何使用全局变量。

所以,我有想要访问设备分配数组的设备函数。

理想情况下,我可以这样做:

但是,我还没有弄清楚如何创建一个动态数组。我通过如下声明数组找到了解决方法:

虽然这不需要 cudaMalloc 调用,但我更喜欢动态分配方法。

0 投票
9 回答
49099 浏览

.net - DataGridView 在我的两个屏幕之一上的可怕重绘性能

我实际上已经解决了这个问题,但我将其发布为后代。

我的双显示器系统上的 DataGridView 遇到了一个非常奇怪的问题。该问题表现为控件的极慢重绘(例如完全重绘需要 30 秒),但仅当它位于我的一个屏幕上时。另一方面,重绘速度很好。

我有一个 Nvidia 8800 GT,带有最新的非 beta 驱动程序(175。一些东西)。是驱动程序错误吗?我将把它留在空中,因为我必须忍受这种特殊的配置。(但它不会发生在 ATI 卡上……)

绘制速度与单元格内容无关,自定义绘制根本不会提高性能——即使只是绘制一个实心矩形也是如此。

后来我发现在表单上放置一个 ElementHost(来自 System.Windows.Forms.Integration 命名空间)可以解决问题。它不必被弄乱;它只需要是 DataGridView 也打开的表单的子项。只要Visible属性为真,它就可以调整为 (0, 0)。

我不想明确地将 .NET 3/3.5 依赖项添加到我的应用程序中;我使用反射创建了一种在运行时(如果可以的话)创建此控件的方法。它可以工作,至少它在没有所需库的机器上优雅地失败了——它只是变慢了。

此方法还允许我在应用程序运行时申请修复,从而更容易查看 WPF 库在我的表单上发生的变化(使用 Spy++)。

经过大量的试验和错误,我注意到在控件本身(而不仅仅是表单)上启用双缓冲可以解决问题!


因此,您只需要基于 DataGridView 创建一个自定义类,以便启用它的 DoubleBuffering。就是这样!

只要我所有的网格实例都使用这个自定义版本,一切都很好。如果我遇到无法使用子类解决方案的情况(如果我没有代码),我想我可以尝试将该控件注入表单:) (虽然我'将更有可能尝试使用反射从外部强制 DoubleBuffered 属性再次避免依赖)。

可悲的是,这么简单的事情占用了我这么多时间……

0 投票
3 回答
21659 浏览

memory - CUDA中常量内存的动态分配

我正在尝试利用常量内存,但我很难弄清楚如何嵌套数组。我所拥有的是一组数据,其中包含内部数据的数量,但每个条目的数量都不同。因此,基于以下简化代码,我有两个问题。首先我不知道如何分配我的数据结构成员指向的数据。其次,由于我不能将 cudaGetSymbolAddress 用于常量内存,我不确定我是否可以只传递全局指针(你不能使用普通的 __device__ 内存)。

感谢您提供的任何帮助。:-)

0 投票
2 回答
690 浏览

graphics - nVidia SLI 技巧

我正在优化一个directx 图形应用程序以利用nVidia 的SLI 技术。我目前正在研究他们的“最佳实践”网页中提到的一些技术,但想知道你们对此有什么建议/经验?

谢谢!

0 投票
2 回答
605 浏览

performance - glGetError hangs for several seconds

I am developing an OpenGL application and I am seeing some strange things happen. The machine I am testing with is equipped with an NVidia Quadro FX 4600 and it is running RHEL WS 4.3 x86_64 (kernel 2.6.9-34.ELsmp).

I've stepped through the application with a debugger and I've noticed that it is hanging on OpenGL calls that are receiving information from the OpenGL API: i.e. - glGetError, glIsEnabled, etc. Each time it hangs up, the system is unresponsive for 3-4 seconds.

Another thing that is interesting is that if this same code is run on RHEL 4.5 (Kernel 2.6.9-67.ELsmp), it runs completely fine. The same code also runs perfectly on Windows XP. All machines are using the exact same hardware:

  • PNY nVidia Quadro FX4600 768mb PCI Express
  • Dual Intel Xeon DP Quad Core E5345 2.33hz
  • 4096 MB 667 MHz Fully Buffered DDR2
  • Super Micro X7DAL-E Intel 5000X Chipset Dual Xeon Motherboard
  • Enermax Liberty 620 watt Power Supply

I have upgraded to the latest 64bit drivers: Version 177.82, Release Date: Nov 12, 2008 and the result is the exact same.

Does anyone have any idea what could be causing the system to hang on these OpenGL calls?

0 投票
2 回答
4096 浏览

windows - 在 Windows XP 中使用多个视频卡进行 OpenGL 渲染

我正在为 Windows XP 开发一个 OpenGL 应用程序。目标机器有 2 个 NVIDIA GeForce 9800GT 显卡,因为应用程序需要输出 2 个模拟视频流,所以需要这些显卡。

应用程序本身有两个 OpenGL 窗口,每个视频卡一个。每个视频卡都连接到一个监视器。至于代码,它基于一个最小的 OpenGL 示例

我如何知道应用程序是否同时使用两个视频卡进行渲染?

目前,我不在乎该应用程序是仅在 Windows XP 上运行还是仅在 NVIDIA 显卡上运行,我只需要知道两者是如何工作的。

0 投票
3 回答
1284 浏览

c++ - 立体视觉(3D 立体)正在卷土重来吗?

我正在使用 C++ 和 OpenGL 开发立体镜应用程序(用于医学图像可视化)。据我了解,这项技术大约在 10 年前是相当大的新闻,但从那以后它似乎已经不复存在了。现在,许多公司似乎都在投资这项技术……包括 nVidia 似乎

立体镜也被称为“3D立体”,主要由nVidia(我认为)。

就我们如何可视化事物而言,有人将立体视觉视为一项主要技术吗?我说的是娱乐和专业的身份。

0 投票
1 回答
615 浏览

physics - 获取 PhysX 轮的位置

我正在使用 NxWheelShape 来模拟我车上的车轮。当我渲染车轮模型时,我使用 shape->getGlobalPose() 来获取一个 4x4 矩阵并在那里渲染车轮。然而,这给了我形状的位置,而不是投射光线撞击其他几何体的位置,所以即使汽车表现正常,车轮也是静止的(甚至不旋转)。获取车轮位置的正确方法是什么?

0 投票
1 回答
1167 浏览

c++ - 为什么我的程序在 nVidia NView 下会消耗 100% CPU?

我最近正在开发一个 Windows 程序,该程序在生产环境中滚动浏览大量项目时有时会变得无响应。当然,它在我的桌面上运行良好。生产环境是:

  • 基于 Windows XP 的工作站,带 2 个显示器
  • 启用 nView 的 nVidia 视频驱动程序

值得注意的是进程终止时生成的 Dr watson 堆栈跟踪:

为什么这个问题只在生产中出现?

0 投票
7 回答
1362 浏览

comparison - PhysX 通过 GPU 获得巨大性能?

我最近比较了一些用于模拟和游戏开发的物理引擎。有些是免费的,有些是开源的,有些是商业的(1 甚至是非常商业的 $$$$)。Havok、Ode、Newton(又名 oxNewton)、Bullet、PhysX 和一些 3D 引擎中的“原始”内置物理。

在某个阶段,我得出了结论或问题:如果我可以利用 GPU 处理带来的惊人性能(如果我需要),我为什么要使用除 NVidia PhysX 之外的任何东西?使用未来的 NVidia 卡,我可以期待独立于常规 CPU 生成步骤的进一步改进。SDK 是免费的,它也可用于 Linux。当然,这有点锁定供应商,而且它不是开源的。

你的观点或经验是什么?如果您现在就开始开发,您是否同意上述观点?

干杯