有没有办法以编程方式检查 C++ 应用程序正在使用多少个内核?
我正在寻找Windows/Linux
解决方案,但当然平台独立的解决方案会更好,我想它要求太多了。
无法知道应用程序使用了多少个内核。但是您可以通过它拥有的线程数来猜测它。
对于窗户:
您将要使用Microsoft 所称的工具帮助库。更具体地说,您将要查看Traversing the Thread List示例,该示例可以获取应用程序拥有的线程数。
微软真的很喜欢让他们的例子尽可能地丑陋,所以这是我想出的一个美化版本,你给它一个 PID,它会列出与之相关的所有线程:
#include <windows.h>
#include <tlhelp32.h>
#include <tchar.h>
#include <cstdio>
bool list(unsigned int PID);
int main(void)
{
list(5532);
list(GetCurrentProcessId());
return 0;
}
bool list(unsigned int PID)
{
HANDLE thread_snap = INVALID_HANDLE_VALUE;
THREADENTRY32 te32;
// Take a snapshot of all running threads
thread_snap = CreateToolhelp32Snapshot(TH32CS_SNAPTHREAD, 0);
if (thread_snap == INVALID_HANDLE_VALUE) return false;
// Fill in the size of the structure before using it.
te32.dwSize = (DWORD)sizeof(THREADENTRY32);
// Retrieve information about the first thread, and exit if unsuccessful
if (!Thread32First(thread_snap, &te32))
{
CloseHandle(thread_snap);
return false;
}
// Now walk the thread list of the system, and display information about each thread associated with the specified process
printf("Printing threads for PID %u\n", PID);
do
{
if (te32.th32OwnerProcessID == PID)
{
printf( "THREAD ID = 0x%08X with base priority %u and delta priority %u\n", (unsigned int)te32.th32ThreadID, (unsigned int)te32.tpBasePri, (unsigned int)te32.tpDeltaPri);
}
}
while (Thread32Next(thread_snap, &te32));
printf("Done printing threads for PID %u\n\n", PID);
// Don't forget to clean up the snapshot object.
CloseHandle(thread_snap);
return true;
}
输入:
5532
(我的 Steam 服务进程 ID),GetCurrentProcessId()
输出:
Printing threads for PID 5532
THREAD ID = 0x00000BCC with base priority 8 and delta priority 0
THREAD ID = 0x0000041C with base priority 8 and delta priority 0
THREAD ID = 0x00001924 with base priority 8 and delta priority 0
THREAD ID = 0x00000C9C with base priority 8 and delta priority 0
Done printing threads for PID 5532
Printing threads for PID 9836
THREAD ID = 0x000000FC with base priority 8 and delta priority 0
Done printing threads for PID 9836
您可以假设,如果应用程序使用的线程数多于 CPU 拥有的内核数,它可能会使用所有线程数,如果使用的线程数较少,则可能会使用 x 个内核数,其中 x 是线程数。
如果您想更进一步,您可以获取每个线程的 CPU 使用率,以更好地估计它使用的内核数。
我不完全确定是否可行的另一种方法是获取应用程序所有线程的 CPU 使用率并将它们相加(以百分比计),获取系统拥有的内核数,将该数字提高到 - 1 并将其乘以 100 ( x^-1*100
),其中 x 是内核数,然后将所有线程的 CPU 使用率百分比除以内核可以处理的百分比,以近似它使用的内核数。
例如:
给定 4 个内核和一个具有 4 个线程的应用程序,其中 2 个的 CPU 使用率为 25%,另外 2 个的 CPU 使用率为 11%。
您可以假设它使用:
(25+25+11+11)/((4^-1)*100) = 2.88 核
问题:
并非所有内核的时钟速度都可能相同。在这种情况下,它不会按预期工作。
如果您使用的是 c++11,您可以通过std::thread::hardware_concurrency()
.
或者,您也可以遍历进程列表并从那里获取进程的线程数,但它没有像遍历线程那样的每个线程的高级信息。
在这里做第二个答案,因为最后一个已经足够长了,这个答案将朝着稍微不同的方向发展。
经过进一步研究,我确定实际上有一种方法可以准确地确定每个线程是/可以运行/运行的核心。我想出的代码大量使用了特定于 Windows 的库,但肯定有 linux 等效函数。
更具体地说,它使用wbemuuid.lib
,comdef.h
和Wbemidl.h
。
编码:
#define _WIN32_DCOM
#include <iostream>
#include <comdef.h>
#include <Wbemidl.h>
#include <cstdarg>
#include <string>
#pragma comment(lib, "wbemuuid.lib")
using namespace std;
DWORD affinity(unsigned int ID)
{
HANDLE threadh = OpenThread(THREAD_SET_INFORMATION | THREAD_QUERY_INFORMATION, FALSE, ID);
DWORD mask = 1;
DWORD old = 0;
while (mask)
{
old = SetThreadAffinityMask(threadh, mask);
if (old)
{
SetThreadAffinityMask(threadh, old);
return old;
}
else
{
if (GetLastError() != ERROR_INVALID_PARAMETER) return 0;
}
mask <<= 1;
}
return 0;
}
HRESULT connect(IWbemLocator** pLoc, IWbemServices** pSvc)
{
HRESULT hres;
hres = CoInitializeEx(0, COINIT_MULTITHREADED);
if (FAILED(hres))
{
cout << "Failed to initialize COM library. Error code = 0x" << hex << hres << endl;
return hres;
}
hres = CoInitializeSecurity(NULL, -1, NULL, NULL, RPC_C_AUTHN_LEVEL_DEFAULT, RPC_C_IMP_LEVEL_IMPERSONATE, NULL, EOAC_NONE, NULL);
if (FAILED(hres))
{
cout << "Failed to initialize security. Error code = 0x" << hex << hres << endl;
CoUninitialize();
return hres;
}
hres = CoCreateInstance( CLSID_WbemLocator, 0, CLSCTX_INPROC_SERVER, IID_IWbemLocator, (LPVOID*)&(*pLoc));
if (FAILED(hres))
{
cout << "Failed to create IWbemLocator object." << " Error code = 0x" << hex << hres << endl;
CoUninitialize();
return hres;
}
hres = (*pLoc)->ConnectServer(_bstr_t(L"ROOT\\CIMV2"), NULL, NULL, 0, NULL, 0, 0, &(*pSvc));
if (FAILED(hres))
{
cout << "Could not connect. Error code = 0x" << hex << hres << endl;
(*pLoc)->Release();
CoUninitialize();
return hres;
}
hres = CoSetProxyBlanket((*pSvc), RPC_C_AUTHN_WINNT, RPC_C_AUTHZ_NONE, NULL, RPC_C_AUTHN_LEVEL_CALL, RPC_C_IMP_LEVEL_IMPERSONATE, NULL, EOAC_NONE);
if (FAILED(hres))
{
cout << "Could not set proxy blanket. Error code = 0x" << hex << hres << endl;
(*pSvc)->Release();
(*pLoc)->Release();
CoUninitialize();
return hres;
}
return hres;
}
HRESULT query(IWbemLocator** pLoc, IWbemServices** pSvc, IEnumWbemClassObject** pEnum, const char* qry)
{
HRESULT hres;
hres = (*pSvc)->ExecQuery(bstr_t("WQL"), bstr_t(qry), WBEM_FLAG_FORWARD_ONLY | WBEM_FLAG_RETURN_IMMEDIATELY, NULL, &(*pEnum));
if (FAILED(hres))
{
cout << "Query for operating system name failed." << " Error code = 0x" << hex << hres << endl;
(*pSvc)->Release();
(*pLoc)->Release();
CoUninitialize();
return 1;
}
return hres;
}
HRESULT parse(IWbemLocator** pLoc, IWbemServices** pSvc, IEnumWbemClassObject** pEnum, IWbemClassObject** pCls, size_t n_args, ...)
{
HRESULT hres;
ULONG uReturn = 0;
while (pEnum)
{
hres = (*pEnum)->Next(WBEM_INFINITE, 1, &(*pCls), &uReturn);
if (0 == uReturn)
{
break;
}
VARIANT vtProp;
va_list vl;
va_start(vl, n_args);
for (size_t i = 0; i < n_args; i++)
{
const char* name = va_arg(vl, const char*);
int wchars_num = MultiByteToWideChar(CP_UTF8, 0, name, -1, NULL, 0);
wchar_t* wname = new wchar_t[wchars_num];
MultiByteToWideChar(CP_UTF8 , 0, name, -1, wname, wchars_num);
hres = (*pCls)->Get(wname, 0, &vtProp, 0, 0);
wcout << wname << " : " << std::to_wstring((size_t)vtProp.bstrVal) << " : " << affinity((DWORD)vtProp.bstrVal) << endl;
delete[] wname;
}
va_end(vl);
VariantClear(&vtProp);
}
return hres;
}
int main(int argc, char **argv)
{
string qry = "SELECT * FROM Win32_PerfFormattedData_PerfProc_Thread WHERE IDProcess = 7424";
HRESULT hres;
IWbemLocator* pLoc = NULL;
IWbemServices* pSvc = NULL;
IEnumWbemClassObject* pEnum = NULL;
IWbemClassObject* pCls = NULL;
hres = connect(&pLoc, &pSvc);
if (FAILED(hres)) return 1;
hres = query(&pLoc, &pSvc, &pEnum, qry.c_str());
if (FAILED(hres)) return 1;
hres = parse(&pLoc, &pSvc, &pEnum, &pCls, 1, "IDThread");
if (FAILED(hres)) return 1;
pSvc->Release();
pLoc->Release();
pEnum->Release();
pCls->Release();
CoUninitialize();
return 0;
}
Prime95 停止时的输出:
IDThread : 9072 : 15
IDThread : 7052 : 15
Prime95 使用 4 个工作线程运行时的输出:
IDThread : 9072 : 15
IDThread : 7052 : 15
IDThread : 5600 : 1
IDThread : 5888 : 2
IDThread : 2888 : 4
IDThread : 9348 : 8
PercentProcessorTime : 0
PercentProcessorTime : 0
PercentProcessorTime : 70
PercentProcessorTime : 83
PercentProcessorTime : 80
PercentProcessorTime : 75
Prime95 使用 2 个工作线程运行时的输出:
IDThread : 9072 : 15
IDThread : 7052 : 15
IDThread : 2352 : 15
IDThread : 8396 : 15
解释:
稍微解释一下代码:
7424
是 Prime95 的 PID。SELECT * FROM Win32_PerfFormattedData_PerfProc_Thread WHERE IDProcess = 7424
是我用来列出与特定 PID 相关的所有线程的查询。您可以从Win32_PerfFormattedData_PerfProc_Thread
这里找到所有信息的列表。您所要做的就是将给定的参数切换parse()
为例如,ThreadID
让我们说它PercentProcessorTime
会输出 CPU 使用百分比。亲和力:
该函数affinity()
将线程关联设置为新的以获取旧的,然后将其设置回旧的。现在,我不确定如何从亲和力中获取实际的核心数,我所知道的是,例如,如果它1
在核心 1 上运行,如果2
它在核心 2 上运行,如果7
它在核心 4 和 3 上运行或类似的规定。我还没有完全弄清楚。
将其移植到 linux:
在 linux 上,这一切都容易一些,例如可以使用sched_getcpu
/之类的东西来获取核心sched_getaffinity
。通过一些谷歌搜索,我相信您也可以找到一种方法来列出与进程关联的所有线程。