问题标签 [cuda-gdb]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cuda-gdb - 在 cuda-gdb 打印命令中取消引用 float2 / struct 没有给出正确的值
我遇到了一个问题,cuda-gdb
即在取消引用它们时在结构(例如 float2)上打印 0。在此示例中,打印 ( zz
) 和z[0]
) 具有不同的结果,即使它们相同。
主文件
cuda-gdb
p zz
印刷{x = 1, y = 2}
p z[0]
印刷{x = 0, y = 0}
c++ - 为什么 cuda-gdb 显示意外的内存值?
我正在编译以下代码片段nvcc -g -G gdbfail.cu
。
当我运行cuda-gdb ./a.out
并在第 10 行 () 放置断点时b 10
,运行代码 ( r
),并尝试在位于的地址处打印值,ptr
我得到了令人惊讶的结果
当我在主机代码 ( b 23
, r
) 中做同样的事情时,我得到了预期的结果:
0x7fffcddff920
为什么当 cuda-gdb 以数字 ( ) 而不是符号 ( )提供地址时,它不显示正确的内存值ptr
?
c++ - 关于CUDA宏__CUDA_ARCH__的问题
我有一个简单的 cuda 代码ttt.cu
使用 CMakeLists.txt:
然后我得到了错误:identifier "__CUDA_ARCH__" is undefined
。我想知道为什么会发生这种情况,我应该怎么做才能使__CUDA_ARCH__
有效?__CUDA_ARCH__
我们可以在头.h
文件中的主机代码中使用 valid吗?
更新:
我打算使用以下 cmake 生成 750 cuda 拱门,但是,这总是导致 a __CUDA_ARCH__
= 300(2080 ti 与 cuda 10.1)。set_property
和都试过了target_compile_options
,都失败了。
python - RuntimeError: CUDA 错误: CUBLAS_STATUS_EXECUTION_FAILED 当调用`cublasSgemm(handle, opa, opb, m, n, k, &alpha, a, lda, b, ldb, &beta, c, ldc)`时
我正在尝试从 BertTopic 模型中提取羽毛,并且正在使用 jupyter notebook。第一个功能是情感分析,它通过以下代码完成: df-DataFrame, df["title_selftext"] - 此数据框列包含文本 (str)
当我试图为这个错误附加 get_sentiment 输出时: RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED 调用时cublasSgemm( handle, opa, opb, m, n, k, &alpha, a, lda, b, ldb, &beta, c, ldc)
请帮我解决这个错误谢谢
cuda - Cuda gdb 打印常量
我在 cuda-gdb 中,我可以使用((@global float *)array)[0]
但是如何在 gdb 中使用常量内存?
我试试((@parameter float *)const_array)
我const_array
这样声明:
__constant__ float const_array[1 << 14]
我试过了1 << 5
,这是同样的问题。