问题标签 [maxwell]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1605 浏览

performance - 不同 GPU 内存空间的访问时间是多少?

这是一个关于离散 GPU 的问题,主要是最近的 GPU(NVIDIA Kepler、Maxwell;以及 AMD Kaveri 和 R290 中的任何东西)。

将其他未缓存的元素从...加载到寄存器中需要多少时间

  • 全局设备内存?
  • 全局内存 L2 缓存?
  • 纹理缓存?
  • 常量缓存?
  • 每核一级缓存?
  • (每核共享内存 - 应该与 L1 缓存相同。)

到某个地方的表格的链接会很棒,一个解释就可以了......

0 投票
1 回答
429 浏览

cuda - 表面记忆开普勒与麦克斯韦之间的区别

鉴于最新两代 NVIDIA GPU 上的以下低级 (SASS) 指令(参考http://docs.nvidia.com/cuda/cuda-binary-utilities/index.html),有哪些(可能是推测的)差异在硬件/内存层次结构设计(和性能影响)?

表面记忆指令MAXWELL

表面内存指令KEPLER

0 投票
1 回答
259 浏览

python - Numbapro 是否支持 Maxwell 架构?

我想使用 Numbapro API 在 python 中执行一个 CUDA 内核。我有这个代码:

给我这个错误:

我尝试了另一个 numbapro 示例,并且出现了相同的错误。我不知道这是不支持 5.2 计算能力的 Numbapro 的错误还是 Nvidia NVVM 的问题......建议?

理论上应该支持,但我不知道发生了什么。

我正在使用带有 CUDA 7.0 和驱动程序版本 346.29 的 Linux

0 投票
1 回答
3946 浏览

cuda - 1 个 CUDA 内核能否在每个时钟(麦克斯韦)处理超过 1 个浮点指令?

Nvidia GPU 列表 - GeForce 900 系列- 上面写着:

4 单精度性能计算为着色器数量乘以基本内核时钟速度的2 倍。

例如,对于 GeForce GTX 970,我们可以计算性能:

1664 核 * 1050 MHz * 2 = 3 494 GFlops 峰值(3 494 400 MFlops)

我们可以在列中看到这个值 - 处理能力(峰值)GFLOPS - 单精度。

但是为什么我们必须乘以 2呢?

有写:http ://devblogs.nvidia.com/parallelforall/maxwell-most-advanced-cuda-gpu-ever-made/

SMM 使用基于象限的设计,具有四个 32 核处理块,每个处理块都有一个专用的 warp 调度程序,能够在每个时钟调度两条指令。

好的,nVidia Maxwell 是超标量架构,每个时钟调度两条指令,但是 1 个 CUDA 核心(FP32-ALU)每个时钟可以处理超过 1 条指令吗?

我们知道 1 个 CUDA-Core 包含两个单元:FP32-unit 和 INT-unit。但是 INT-unit 与 GFlops (每秒浮点操作数)无关。

即一个 SMM 包含:

  • 128 FP32-单元
  • 128 INT单元
  • 32 SFU-单元
  • 32 LD/ST-单元

为了在GFlops中获得性能,我们应该只使用:128 个 FP32 单元和 32 个 SFU 单元。

即,如果我们同时使用 128 个 FP32 单元和 32 个 SFU 单元,那么每 1 个 SM 每个时钟可以得到 160 条带有浮点运算的指令。

即我们必须乘以 1,2 =(160/132) 而不是 2。

1664 核 * 1050 MHz * 1,2 = 2 096 GFlops 峰值

为什么在 wiki 中写到我们必须将 Cores*MHz 乘以 2?

在此处输入图像描述

在此处输入图像描述

0 投票
1 回答
1378 浏览

caching - CUDA将数据从全局内存缓存到统一缓存,再存入共享内存?

据我所知,GPU 遵循步骤(全局内存-l2-l1-寄存器共享内存)将数据存储到以前的 NVIDIA GPU 架构的共享内存中。

但是maxwell gpu(GTX980)在物理上分离了统一缓存和共享内存,我想知道这个架构也是按照同样的步骤来存储数据到共享内存的吗?还是它们支持全局内存和共享内存之间的直接通信?

  • 使用选项“-dlcm=ca”启用统一缓存
0 投票
1 回答
182 浏览

apache-kafka - json中的Maxwell xid写入按摩队列

我可以在下面的 json 中看到,我们在写入 kafka 的所有 jason 中都有一个 xid。

我想知道的是,

  1. 这个 xid 对于每个事件是唯一的吗?这样我就可以让你使用那个 xid 来唯一地标识一个数据库事件。
  2. 这甚至因某种原因而被怨恨,这些事件会具有相同的 xid 吗?

注意:我尝试通过手动更改 position.binlog_positions 并在新服务器中启动新的 maxwell 实例来重新发送相同的事件。我从新的 maxwell 实例中获得了相同事件的相同 xid。

0 投票
1 回答
62 浏览

cuda - 麦克斯韦的 Cuda 优化

我正在尝试了解有关指令级分析的并行 forall 帖子尤其是Reducing Memory Dependency Stalls部分中的以下几行:

NVIDIA GPU 没有索引寄存器文件,因此如果使用动态索引访问堆栈数组,编译器必须在本地内存中分配数组。在 Maxwell 架构中,本地内存存储不会缓存在 L1 中,因此存储后本地内存加载的延迟很重要。

我了解什么是寄存器文件,但它们没有被索引是什么意思?为什么它会阻止编译器存储使用动态索引访问的堆栈数组?

引用说数组将存储在本地内存中。在下面的架构中,这个本地内存对应什么块?

在此处输入图像描述

0 投票
0 回答
37 浏览

mysql - 从 Spring Boot 获取 MySQL thread_id

如何通过 Spring Boot 服务获取当前 DB 更改的 thread_id。

我查看了 DataSource 但在此,我找不到任何与 thread_id 相关的东西。

我正在关注medium.com 的一篇文章

在这里,我们使用 Maxwell 获取数据库更改日志。Maxwell 正在使用 Kafka 中的 DB thread_id 生成更改日志。

当有人点击服务的任何 REST 端点时,该服务使用其逻辑修改一个在 DB 中插入一些记录(此更改将与 MySQL 相关thread_id),Maxwell 在 Kafka 中推送与 DB 中所做的修改相关的消息,该服务必须使用映射 DBthread_id和 Service的 MySQL Blackhole Engine 在 DB 中创建一个条目request_id。我们如何向 MySQL 请求获取thread_id.

0 投票
1 回答
177 浏览

maxwell - maxwell配置中的exclude和blacklist有什么区别

我在看麦克斯韦代码,

https://github.com/zendesk/maxwell

https://github.com/zendesk/maxwell/blob/master/config.properties.example

有人可以澄清一下maxwell过滤器配置中排除黑名单之间的区别吗?

0 投票
0 回答
34 浏览

ode - 麦克斯韦斯特凡常微分方程

我试图在膜上求解 Maxwell Stefan 方程,以获得膜厚度“z”上的瞬态摩尔分数分布。但不知何故,我无法使用 ODE45 对其进行编码,更有可能我无法编写使用 ODE45 解决的系统。如果有人可以帮助我了解主要的语法和功能,那就太好了。我试图解决的方程是

(dy_i)/dz=1/(cD_(i,j) ) [y_i (N_i+N_j )-N_i ]

其中 c 是浓度,D_(i,j) 是二元扩散系数。

先感谢您。