问题标签 [tesla]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - 即使在 cudaSetDevice 之后,第一个 cudaMalloc(K40 与 K20)的速度也很慢
我知道 CUDA 会在第一次 API 调用期间进行初始化,但是花费的时间太多了。即使在单独的 cudaSetDevice 之后
测试程序:
使用以下代码构建的相同程序:CUDA 7.0 (compute_35) + Visual Studio 2012 + NSight 4.5,然后在 2 台单独的机器上运行(无重建)
在第一个 cudaMalloc 之前,我称之为“cudaSetDevice”</p>
在我的电脑上:Win7 + Tesla K20,第一个 cudaMalloc 需要 150 毫秒
在我的服务器上:Win2012+ Tesla K40,需要1100ms!!
对于两台机器,后续的 cudaMalloc 都快得多。
我的问题是:
1、为什么K40第一个cudaMalloc需要更长的时间(1100ms vs 150ms)?因为K40应该比K20好
2、我以为“cudaSetDevice”可以捕获Init时间?例如来自 talonmies 的这个答案
3、如果初始化是不可避免的,进程A可以在GPU中保持其状态(或上下文)而进程B在同一个GPU中运行吗?我知道我最好在“独占”模式下运行 GPU,但可以处理“暂停”,以便以后不需要再次初始化 GPU?
提前致谢
ssl - Nginx 错误:“没有共享密码”。但是这里有
我的 Nginx 服务器有一个 SSL 证书,看起来非常好,并且可以在大多数浏览器中完美运行。服务器是https://live.evmote.com。您可以通过访问https://live.evmote.com/primus来“访问”服务器。SSL 证书检查在这里: https ://www.ssllabs.com/ssltest/analyze.html?d=live.evmote.com
到目前为止,一切都很好。问题出在特斯拉 Model S 浏览器(车载浏览器)上。它给出了“错误的证书”错误。众所周知,Tesla 浏览器很糟糕,并且支持不完整。无法从 Tesla 查看证书链或调试问题。它更像是一个电器,而不是一台电脑。这是特斯拉内部的 SSL 支持:http: //i.imgur.com/EbIrClM.jpg
在 Nginx 服务器上,我在日志中收到此错误: SSL3_GET_CLIENT_HELLO:no shared cipher
现在,从 Tesla SSL 报告和服务器报告中可以清楚地看出,存在共享密码。我希望他们会在这个上握手:TLS_RSA_WITH_AES_256_CBC_SHA (0x35)
我不确定如何从这里进行故障排除。
谢谢,瑞安
cuda - 如果网格尺寸太大,Cuda 不会修改输入
考虑以下代码:
如果块的数量大于或等于 65536,则不会修改输入数组,尽管device_query
从 CUDA 代码示例中说,x 维度中的最大大小远大于 65536:
我做错了什么还是硬件对它的功能撒了谎?这是一个已知的错误?不应该抛出错误吗?
opencl - 特斯拉 K80 和 OpenCL
我有一个 Nvidia Tesla K80 坐在一个 LINUX 盒子里。我知道 Tesla K80 内部有两个 GPU。当我在那台机器上运行 OpenCL 程序,遍历所有设备时,我看到了四个设备(4 个 Tesla K80)。你知道为什么会发生这种情况吗?
这是主机代码:
这是输出:
cuda - 在 Maxwell GPU 上使用为计算能力 3.7 编译的 CUDA?
我的开发工作站目前有 NVIDIA Quadro K2200 和 K620。两者都具有 CUDA 计算能力 5.0。然而,最终的生产系统有一个 CUDA 计算能力为 3.7 的 Tesla K80。
是否可以在我的 Quadro GPU 上安装和开发用于计算能力 3.7 的 CUDA 程序,然后将它们转移到 K80 而无需进行重大更改?
cuda - CUDA:safeCall() 运行时 API 错误,设备符号无效
我正在尝试在具有 CUDA 7.5 的远程计算机上使用 Nvidia Tesla M2090运行cudaSift
in CudaSift项目。这台机器有 4 个这样的 GPU,但我从调试中很确定初始化是正确完成的,无论如何这是代码:
我使用cmake生成makefile,make
文件生成cudaSift
没有任何错误。
无论如何,当我运行它时,会返回以下错误:
在第 42 行cudaSiftH.cu
是:
在哪里:
InitCuda
这是由(确保初始化期间一切正常)打印的代码:
解决方案:
正如评论中所建议的,我正在使用错误的架构进行编译:我不得不将每个更改为sm_35
,结果如下:CMakeList.txt
sm_20
cuda - CUDA 未知错误
我正在尝试在 Nvidia Tesla M2090 上mainSift.cpp
从CudaSift运行。首先,正如在这个问题中所解释的那样,我必须从 更改sm_35
为. sm_20
CMakeLists.txt
Unfortunatley 现在返回此错误:
这是LaplaceMulti
代码:
我已经阅读了这个看起来有些相似的问题,但我不明白解决方案的含义或如何将其用于我的问题。
为什么会发生错误?
windows - Caffe on Windows common.cpp:166] 检查失败:错误 == cudaSuccess
当我为 Caffe win7 使用两个不同的 GPU 时,它不起作用。OS系统:win7 SP1 GPUs:Quadro K620、Tesla K40 Caffe:Caffe for windows 问题是每次我更新到最新的K620驱动369.26,那么Tesla K40就不行了。然后当我为 Tesla K40 更新到最新的 Driver 341.96 时,K620 将无法工作。因此,当我使用双 GPU 时,它不适用于 caffe,错误是:
如果我只使用 GPU Tesla K40(仅使用 Quadro,它可以工作),错误是:
tensorflow - TensorFlow 的 Tesla K80 内存使用情况
我已经为带有 Tesla k80 GPU 的 TensorFlow 运行了卷积神经网络的示例代码。
“GPU 1”的内存使用量为 11Gb,约为 12Gb 最大值的 95%。但是“GPU 2”的内存使用量只有 64Mb。你能告诉我如何在 Tesla K80 上使用 GPU 的内存和 TensorFlow 吗?
gpu - 在没有 sudo 权限的情况下释放 GPU 内存
我使用 theano 进行一些深度学习实验。我已经通过 ctrl+c 杀死了一个运行了 3 周的进程,以启动一个新进程。
如我所见,虽然我已经杀死了进程,但gpu内存并没有被释放。根据 nvidia-smi,内存是免费的,除了 23MB 的少量使用。我用特斯拉k40。
但实际上,当我尝试运行非常小的数据集时,我会遇到内存错误。如果它只有 23 MB 的使用量,那根本不是问题。
我在使用的机器上没有 sudo 权限。我该如何解决这个问题?