问题:我们在 Windows Server 2012 系统上实现了一个视频录制系统。尽管 CPU 和内存消耗较低,但我们仍面临严重的性能问题。
简短的程序描述:应用程序(VS2005/C++)创建许多网络套接字,每个套接字从以太网网络接收多播 UDP 视频流。对于每个流,应用程序通过调用 WSARecvFrom()(重叠操作)提供接收缓冲区,在 MsgWaitForMultipleObjects() 中等待 Window 的“数据到达”事件,获取数据包,然后在无限循环中再次重复所有操作。对于测试,除了纯套接字 IO 工作之外,为了确保最小的 CPU 和内存消耗,应用程序什么都不做,也不做任何磁盘/文件 IO。应用程序进程被配置为使用机器上所有可用的内核(默认关联设置不变)。
测试运行:测试在两台不同的机器上运行:a)具有 4 个物理内核/8 个超线程的 Windows 7,b)具有 12 个物理内核/24 个超线程的 Windows Server 2012。
两个系统都显示出相同的问题:在配置一定数量的套接字/网络流之前一切正常。进一步增加它们(我们需要)最终使 Windows 桌面瘫痪(鼠标指针,重新绘制)。在这个阶段,总的 CPU 负载仍然非常低(即 10-15%),并且有很多可用内存。但是任务管理器显示了极其单向的 CPU 负载:CPU 0 接近 100%,所有其他 CPU 接近 0%。在任务管理器中更改进程的处理器亲和力没有帮助。
问题 1:看起来 CPU 0 正在做整个内核的网络 IO 工作。有可能吗?
问题2:如果是,有没有办法控制内核对可用CPU的使用?如果是,如何?
问题3:如果没有,是否有任何其他方法可以让Windows将(内核)网络IO工作分配给其他CPU(即通过安装多个网卡,每个网卡只接收网络流的一个子集,并将每个网卡绑定到另一个中央处理器) ?
非常感谢任何人的任何提示。