“maxwell”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

1605 浏览

performance - 不同 GPU 内存空间的访问时间是多少？

这是一个关于离散 GPU 的问题，主要是最近的 GPU（NVIDIA Kepler、Maxwell；以及 AMD Kaveri 和 R290 中的任何东西）。

将其他未缓存的元素从...加载到寄存器中需要多少时间

全局设备内存？
全局内存 L2 缓存？
纹理缓存？
常量缓存？
每核一级缓存？
（每核共享内存 - 应该与 L1 缓存相同。）

到某个地方的表格的链接会很棒，一个解释就可以了......

2015-05-21T10:56:31.597

0 投票

1 回答

429 浏览

cuda - 表面记忆开普勒与麦克斯韦之间的区别

鉴于最新两代 NVIDIA GPU 上的以下低级 (SASS) 指令（参考http://docs.nvidia.com/cuda/cuda-binary-utilities/index.html），有哪些（可能是推测的）差异在硬件/内存层次结构设计（和性能影响）？

表面记忆指令MAXWELL

表面内存指令KEPLER

cuda nvidia kepler maxwell

2015-05-22T22:23:19.287

0 投票

1 回答

259 浏览

python - Numbapro 是否支持 Maxwell 架构？

我想使用 Numbapro API 在 python 中执行一个 CUDA 内核。我有这个代码：

给我这个错误：

我尝试了另一个 numbapro 示例，并且出现了相同的错误。我不知道这是不支持 5.2 计算能力的 Numbapro 的错误还是 Nvidia NVVM 的问题......建议？

理论上应该支持，但我不知道发生了什么。

我正在使用带有 CUDA 7.0 和驱动程序版本 346.29 的 Linux

python cuda numba-pro maxwell

2015-07-16T20:37:10.820

0 投票

1 回答

3946 浏览

cuda - 1 个 CUDA 内核能否在每个时钟（麦克斯韦）处理超过 1 个浮点指令？

Nvidia GPU 列表 - GeForce 900 系列- 上面写着：

4 单精度性能计算为着色器数量乘以基本内核时钟速度的2 倍。

例如，对于 GeForce GTX 970，我们可以计算性能：

1664 核 * 1050 MHz * 2 = 3 494 GFlops 峰值（3 494 400 MFlops）

我们可以在列中看到这个值 - 处理能力（峰值）GFLOPS - 单精度。

但是为什么我们必须乘以 2呢？

有写：http ://devblogs.nvidia.com/parallelforall/maxwell-most-advanced-cuda-gpu-ever-made/

SMM 使用基于象限的设计，具有四个 32 核处理块，每个处理块都有一个专用的 warp 调度程序，能够在每个时钟调度两条指令。

好的，nVidia Maxwell 是超标量架构，每个时钟调度两条指令，但是 1 个 CUDA 核心（FP32-ALU）每个时钟可以处理超过 1 条指令吗？

我们知道 1 个 CUDA-Core 包含两个单元：FP32-unit 和 INT-unit。但是 INT-unit 与 GFlops （每秒浮点操作数）无关。

即一个 SMM 包含：

128 FP32-单元
128 INT单元
32 SFU-单元
32 LD/ST-单元

为了在GFlops中获得性能，我们应该只使用：128 个 FP32 单元和 32 个 SFU 单元。

即，如果我们同时使用 128 个 FP32 单元和 32 个 SFU 单元，那么每 1 个 SM 每个时钟可以得到 160 条带有浮点运算的指令。

即我们必须乘以 1,2 =(160/132) 而不是 2。

1664 核 * 1050 MHz * 1,2 = 2 096 GFlops 峰值

为什么在 wiki 中写到我们必须将 Cores*MHz 乘以 2？

cuda benchmarking gpgpu nvidia maxwell

2015-10-02T13:58:51.903

0 投票

1 回答

1378 浏览

caching - CUDA将数据从全局内存缓存到统一缓存，再存入共享内存？

据我所知，GPU 遵循步骤（全局内存-l2-l1-寄存器共享内存）将数据存储到以前的 NVIDIA GPU 架构的共享内存中。

但是maxwell gpu(GTX980)在物理上分离了统一缓存和共享内存，我想知道这个架构也是按照同样的步骤来存储数据到共享内存的吗？还是它们支持全局内存和共享内存之间的直接通信？

使用选项“-dlcm=ca”启用统一缓存

caching cuda maxwell

2016-04-20T06:13:15.590

0 投票

1 回答

182 浏览

apache-kafka - json中的Maxwell xid写入按摩队列

我可以在下面的 json 中看到，我们在写入 kafka 的所有 jason 中都有一个 xid。

我想知道的是，

这个 xid 对于每个事件是唯一的吗？这样我就可以让你使用那个 xid 来唯一地标识一个数据库事件。
这甚至因某种原因而被怨恨，这些事件会具有相同的 xid 吗？

注意：我尝试通过手动更改 position.binlog_positions 并在新服务器中启动新的 maxwell 实例来重新发送相同的事件。我从新的 maxwell 实例中获得了相同事件的相同 xid。

apache-kafka maxwell bigdata

2016-07-03T12:59:11.867

0 投票

1 回答

62 浏览

cuda - 麦克斯韦的 Cuda 优化

我正在尝试了解有关指令级分析的并行 forall 帖子。尤其是Reducing Memory Dependency Stalls部分中的以下几行：

NVIDIA GPU 没有索引寄存器文件，因此如果使用动态索引访问堆栈数组，编译器必须在本地内存中分配数组。在 Maxwell 架构中，本地内存存储不会缓存在 L1 中，因此存储后本地内存加载的延迟很重要。

我了解什么是寄存器文件，但它们没有被索引是什么意思？为什么它会阻止编译器存储使用动态索引访问的堆栈数组？

引用说数组将存储在本地内存中。在下面的架构中，这个本地内存对应什么块？

cuda gpu gpgpu maxwell

2017-04-13T12:29:45.740

0 投票

0 回答

37 浏览

mysql - 从 Spring Boot 获取 MySQL thread_id

如何通过 Spring Boot 服务获取当前 DB 更改的 thread_id。

我查看了 DataSource 但在此，我找不到任何与 thread_id 相关的东西。

我正在关注medium.com 的一篇文章。

在这里，我们使用 Maxwell 获取数据库更改日志。Maxwell 正在使用 Kafka 中的 DB thread_id 生成更改日志。

当有人点击服务的任何 REST 端点时，该服务使用其逻辑修改一个在 DB 中插入一些记录（此更改将与 MySQL 相关thread_id），Maxwell 在 Kafka 中推送与 DB 中所做的修改相关的消息，该服务必须使用映射 DBthread_id和 Service的 MySQL Blackhole Engine 在 DB 中创建一个条目request_id。我们如何向 MySQL 请求获取thread_id.

mysql spring-boot apache-kafka maxwell

2018-05-11T07:35:16.460

0 投票

1 回答

177 浏览

maxwell - maxwell配置中的exclude和blacklist有什么区别

我在看麦克斯韦代码，

https://github.com/zendesk/maxwell

https://github.com/zendesk/maxwell/blob/master/config.properties.example。

有人可以澄清一下maxwell过滤器配置中排除和黑名单之间的区别吗？

maxwell

2019-11-22T11:09:15.033

0 投票

0 回答

34 浏览

ode - 麦克斯韦斯特凡常微分方程

我试图在膜上求解 Maxwell Stefan 方程，以获得膜厚度“z”上的瞬态摩尔分数分布。但不知何故，我无法使用 ODE45 对其进行编码，更有可能我无法编写使用 ODE45 解决的系统。如果有人可以帮助我了解主要的语法和功能，那就太好了。我试图解决的方程是

(dy_i)/dz=1/(cD_(i,j) ) [y_i (N_i+N_j )-N_i ]

其中 c 是浓度，D_(i,j) 是二元扩散系数。

先感谢您。

ode ode45 maxwell

2020-04-16T14:51:00.793

问题标签 [maxwell]

Reference