问题标签 [kepler]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
1098 浏览

cuda - Kepler CUDA 动态并行和线程发散

关于Kepler的资料很少dynamic parallelism,从这项新技术的描述来看,是不是意味着同一个warp中线程控制流发散的问题已经解决了?

它允许recursion从设备代码中获取内核,这是否意味着不同线程中的控制路径可以同时执行?

0 投票
1 回答
744 浏览

assembly - 了解 Nvidia Kepler 组装说明

我遇到了这个文件 cuobjdump.pdf

它列出了费米和开普勒指令,但没有额外的解释。

除了通常的加法、减法、乘法等。我不明白其他指令的含义或作用。任何人都可以帮助我或将我指向解释它们的文档或链接吗?

0 投票
2 回答
2166 浏览

cuda - 监控 NVENC 硬件(活动或空闲)

我们可以像这样使用 nvenc 硬件查询可用的 GPU:

我有 8 个带有 NVENC 功能的 GPU:

我们如何检查特定的 NVENC 硬件现在是否正在运行或空闲。有什么方法可以监控 NVENC 硬件吗?

帮助我找出哪个 GPU 或 NVENC 硬件空闲的特定 NVENC API 函数“OR”CUDA 驱动程序或 API 函数怎么样?

注意:我知道 CUDA 和 NVENC 硬件是完全独立的东西,但我正在寻找直接或间接(使用 Cuda API,例如使用 Cuda 来指定可用的 NVENC 硬件)检查特定 NVENC 状态的方法???

0 投票
1 回答
957 浏览

cuda - 为什么在 Kepler 架构上 GPU 的初始化需要很长时间,如何解决这个问题?

运行我的应用程序时,第一个 cuda_malloc 需要 40 秒,这是由于 GPU 的初始化。当我在调试模式下构建时,这减少到 5 秒,而当我在 Fermi 设备上运行相同的代码时,它需要的时间远远少于一秒(在我的情况下甚至不值得测量)。

现在有趣的是,如果我为这个特定的架构进行编译,使用标志 sm35 而不是 sm20,它会再次变得更快。由于我现在不应该使用任何新的 sm35 功能,我怎样才能为 sm20 编译而不会有这么大的延迟?我也很好奇是什么导致了这种延迟?机器代码是否即时重新编译为 sm35 代码?

附言。我在 Windows 上运行,但我的一位同事遇到了同样的问题,可能是在 Windows 上。该设备是 Kepler,驱动程序版本 320。

0 投票
1 回答
277 浏览

cuda - Kepler CC3.0/3.5、16 或 32 (STREAM) 上同时支持多少个内核?

正如我们所知,Fermi 仅支持与 GPU 的单一连接,如下所述:http: //on-demand.gputechconf.com/gtc-express/2011/presentations/StreamsAndConcurrencyWebinar.pdf

Fermi 架构可以同时支持

GPU 上多达 16 个 CUDA 内核

正如我们所知,Hyper-Q 允许来自多个 CUDA 流、MPI 进程或进程中的线程的多达 32 个同时连接:http ://www.nvidia.com/content/PDF/kepler/NVIDIA-Kepler-GK110-建筑-白皮书.pdf

但是在Kepler CC3.0/3.5、16 或 32 (STREAMs)上同时支持多少个内核?

0 投票
2 回答
507 浏览

swt - Kepler RCP CoolBar + PerspectiveBar 外观

所有 Kepler RCP 应用程序上的酷栏看起来都很糟糕。这是一个在 Windows 8 上从头开始创建的项目。

酷棒周围那条粗黑线是怎么回事?
可以用 CSS 进行样式修改吗?

从我的测试来看,它似乎只在存在透视栏时才会出现。

在此处输入图像描述

0 投票
1 回答
482 浏览

cuda - 错误:不支持外部调用(发现对 cublasGetVersion_v2 的非内联调用)

我正在尝试使用调用 cublasIdamax() 但我遇到了类似标题的错误。所以我写了一个简单的代码来验证cublas的版本,以避免函数签名中的版本错误。但即使是这个简单的代码也会导致编译错误。

这是我的代码:

我在第 3 行出现以下错误:不支持外部调用(发现对 cublasGetVersion_v2 的非内联调用)

我做错了什么?

PS.:我看了这个主题 https://devtalk.nvidia.com/default/topic/500814/external-calls-are-not-supported-found-non-inlined-call-to-meminit-/ 但我仍然有问题。

0 投票
1 回答
641 浏览

cuda - “全局负载效率”超过 100%

我有一个 CUDA 程序,其中在多次迭代和内存访问中,一个长数组的块读取元素的线程几乎完全合并。当我分析时,全局负载效率超过 100%(在 119% 和 187% 之间,具体取决于输入)。全局负载效率的描述是“全局内存负载吞吐量与所需的全局内存负载吞吐量之比”。这是否意味着我经常使用二级缓存并且我的内存访问从中受益?

我的 GPU 是 GeForce GTX 780(Kepler 架构)。

0 投票
1 回答
534 浏览

cuda - 当存在 L1 和 L2 缓存级别时,是否会同时序列化对一个地址的全局内存访问?

据我所知,当扭曲的线程访问全局内存中的相同地址时,请求会被序列化,因此最好使用常量内存。当 GPU 配备 L1 和 L2 缓存级别(在 Fermi 和 Kepler 架构中)时,是否会同时进行全局内存访问的序列化?换句话说,当一个warp的线程访问相同的全局内存地址时,一个warp的31个线程是否会从缓存的存在中受益,因为1个线程已经请求了该地址?当访问是读取以及访问是写入时会发生什么?

0 投票
1 回答
363 浏览

tomcat7 - Tomcat 7 没有在我的 Eclipse Kepler 中运行

当我尝试运行 tomcat 时,它显示错误

信息:启动 Servlet 引擎:Apache Tomcat/7.0.14 org.apache.tomcat.util.bcel.classfile.ClassFormatException:常量池中的无效字节标记:org.apache.tomcat.util.bcel.classfile.Constant.readConstant 中的 15 (Constant.java:131) 在 org.apache.tomcat.util.bcel.classfile.ConstantPool.(ConstantPool.java:60) 在 org.apache.tomcat.util.bcel.classfile.ClassParser.readConstantPool(ClassParser.java: 209) 在 org.apache.catalina.startup.ContextConfig.processAnnotationsStream(ContextConfig.java:1930) 在 org.apache.catalina 的 org.apache.tomcat.util.bcel.classfile.ClassParser.parse(ClassParser.java:119) .startup.ContextConfig.processAnnotationsJar(ContextConfig.java:1826) 在 org.apache.catalina.startup.ContextConfig.processAnnotationsUrl(ContextConfig.java:1785) 在 org.apache.catalina.startup.ContextConfig。processAnnotations(ContextConfig.java:1771) at org.apache.catalina.startup.ContextConfig.webConfig(ContextConfig.java:1254) at org.apache.catalina.startup.ContextConfig.configureStart(ContextConfig.java:881) at org.apache .catalina.startup.ContextConfig.lifecycleEvent(ContextConfig.java:316) at org.apache.catalina.util.LifecycleSupport.fireLifecycleEvent(LifecycleSupport.java:119) at org.apache.catalina.util.LifecycleBase.fireLifecycleEvent(LifecycleBase.java :89) 在 org.apache.catalina.util.LifecycleBase.start(LifecycleBase.java:145) 在 org.apache.catalina.core 的 org.apache.catalina.core.StandardContext.startInternal(StandardContext.java:5103)。 org.apache.catalina.core.StandardHost.startInternal(StandardHost.java:774) 中的 org.apache.catalina.util 中的 ContainerBase.startInternal(ContainerBase.java:1033)。LifecycleBase.start(LifecycleBase.java:145) at org.apache.catalina.core.ContainerBase.startInternal(ContainerBase.java:1033) at org.apache.catalina.core.StandardEngine.startInternal(StandardEngine.java:291) at org .apache.catalina.util.LifecycleBase.start(LifecycleBase.java:145) 在 org.apache.catalina.core.StandardService.startInternal(StandardService.java:443) 在 org.apache.catalina.util.LifecycleBase.start(LifecycleBase .java:145) 在 org.apache.catalina.core.StandardServer.startInternal(StandardServer.java:727) 在 org.apache.catalina.util.LifecycleBase.start(LifecycleBase.java:145) 在 org.apache.catalina。 startup.Catalina.start(Catalina.java:620) 在 sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) 在 sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57) 在 sun.reflect。DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43) at java.lang.reflect.Method.invoke(Method.java:483) at org.apache.catalina.startup.Bootstrap.start(Bootstrap.java:303) at org.apache .catalina.startup.Bootstrap.main(Bootstrap.java:431)