6

有没有办法以编程方式检查 C++ 应用程序正在使用多少个内核?

我正在寻找Windows/Linux解决方案,但当然平台独立的解决方案会更好,我想它要求太多了。

4

2 回答 2

3

无法知道应用程序使用了多少个内核。但是您可以通过它拥有的线程数来猜测它。

对于窗户:

您将要使用Microsoft 所称的工具帮助库。更具体地说,您将要查看Traversing the Thread List示例,该示例可以获取应用程序拥有的线程数。

微软真的很喜欢让他们的例子尽可能地丑陋,所以这是我想出的一个美化版本,你给它一个 PID,它会列出与之相关的所有线程:

#include <windows.h>
#include <tlhelp32.h>
#include <tchar.h>
#include <cstdio>

bool list(unsigned int PID);

int main(void)
{
    list(5532);
    list(GetCurrentProcessId());

    return 0;
}

bool list(unsigned int PID)
{
    HANDLE thread_snap = INVALID_HANDLE_VALUE;
    THREADENTRY32 te32;

    // Take a snapshot of all running threads
    thread_snap = CreateToolhelp32Snapshot(TH32CS_SNAPTHREAD, 0);
    if (thread_snap == INVALID_HANDLE_VALUE) return false;

    // Fill in the size of the structure before using it.
    te32.dwSize = (DWORD)sizeof(THREADENTRY32);

    // Retrieve information about the first thread, and exit if unsuccessful
    if (!Thread32First(thread_snap, &te32))
    {
        CloseHandle(thread_snap);
        return false;
    }

    // Now walk the thread list of the system, and display information about each thread associated with the specified process
    printf("Printing threads for PID %u\n", PID); 
    do
    {
        if (te32.th32OwnerProcessID == PID)
        {
            printf( "THREAD ID = 0x%08X with base priority %u and delta priority %u\n", (unsigned int)te32.th32ThreadID, (unsigned int)te32.tpBasePri, (unsigned int)te32.tpDeltaPri);
        }
    }
    while (Thread32Next(thread_snap, &te32));
    printf("Done printing threads for PID %u\n\n", PID);

    //  Don't forget to clean up the snapshot object.
    CloseHandle(thread_snap);

    return true;
}

输入:

5532(我的 Steam 服务进程 ID),GetCurrentProcessId()

输出:

Printing threads for PID 5532
THREAD ID = 0x00000BCC with base priority 8 and delta priority 0
THREAD ID = 0x0000041C with base priority 8 and delta priority 0
THREAD ID = 0x00001924 with base priority 8 and delta priority 0
THREAD ID = 0x00000C9C with base priority 8 and delta priority 0
Done printing threads for PID 5532

Printing threads for PID 9836
THREAD ID = 0x000000FC with base priority 8 and delta priority 0
Done printing threads for PID 9836

您可以假设,如果应用程序使用的线程数多于 CPU 拥有的内核数,它可能会使用所有线程数,如果使用的线程数较少,则可能会使用 x 个内核数,其中 x 是线程数。

如果您想更进一步,您可以获取每个线程的 CPU 使用率,以更好地估计它使用的内核数。


我不完全确定是否可行的另一种方法是获取应用程序所有线程的 CPU 使用率并将它们相加(以百分比计),获取系统拥有的内核数,将该数字提高到 - 1 并将其乘以 100 ( x^-1*100),其中 x 是内核数,然后将所有线程的 CPU 使用率百分比除以内核可以处理的百分比,以近似它使用的内核数。

例如:

给定 4 个内核和一个具有 4 个线程的应用程序,其中 2 个的 CPU 使用率为 25%,另外 2 个的 CPU 使用率为 11%。

您可以假设它使用:

(25+25+11+11)/((4^-1)*100) = 2.88 核

问题:

并非所有内核的时钟速度都可能相同。在这种情况下,它不会按预期工作。


如果您使用的是 c++11,您可以通过std::thread::hardware_concurrency().

或者,您也可以遍历进程列表并从那里获取进程的线程数,但它没有像遍历线程那样的每个线程的高级信息。

于 2013-05-28T12:55:43.813 回答
3

在这里做第二个答案,因为最后一个已经足够长了,这个答案将朝着稍微不同的方向发展。

经过进一步研究,我确定实际上有一种方法可以准确地确定每个线程是/可以运行/运行的核心。我想出的代码大量使用了特定于 Windows 的库,但肯定有 linux 等效函数。

更具体地说,它使用wbemuuid.lib,comdef.hWbemidl.h


编码:

#define _WIN32_DCOM

#include <iostream>
#include <comdef.h>
#include <Wbemidl.h>
#include <cstdarg>
#include <string>

#pragma comment(lib, "wbemuuid.lib")

using namespace std;

DWORD affinity(unsigned int ID)
{
    HANDLE threadh = OpenThread(THREAD_SET_INFORMATION | THREAD_QUERY_INFORMATION, FALSE, ID);

    DWORD mask = 1;
    DWORD old = 0;

    while (mask)
    {
        old = SetThreadAffinityMask(threadh, mask);
        if (old)
        {
            SetThreadAffinityMask(threadh, old);
            return old;
        }
        else
        {
            if (GetLastError() != ERROR_INVALID_PARAMETER) return 0;
        }
        mask <<= 1;
    }

    return 0;
}

HRESULT connect(IWbemLocator** pLoc, IWbemServices** pSvc)
{
    HRESULT hres;

    hres = CoInitializeEx(0, COINIT_MULTITHREADED); 
    if (FAILED(hres))
    {
        cout << "Failed to initialize COM library. Error code = 0x" << hex << hres << endl;
        return hres;
    }

    hres = CoInitializeSecurity(NULL, -1, NULL, NULL, RPC_C_AUTHN_LEVEL_DEFAULT, RPC_C_IMP_LEVEL_IMPERSONATE, NULL, EOAC_NONE, NULL);
    if (FAILED(hres))
    {
        cout << "Failed to initialize security. Error code = 0x" << hex << hres << endl;
        CoUninitialize();
        return hres;
    }

    hres = CoCreateInstance( CLSID_WbemLocator, 0, CLSCTX_INPROC_SERVER, IID_IWbemLocator, (LPVOID*)&(*pLoc));
    if (FAILED(hres))
    {
        cout << "Failed to create IWbemLocator object." << " Error code = 0x" << hex << hres << endl;
        CoUninitialize();
        return hres;
    }

    hres = (*pLoc)->ConnectServer(_bstr_t(L"ROOT\\CIMV2"), NULL, NULL, 0, NULL, 0, 0, &(*pSvc));
    if (FAILED(hres))
    {
        cout << "Could not connect. Error code = 0x" << hex << hres << endl;
        (*pLoc)->Release(); 
        CoUninitialize();
        return hres;
    }

    hres = CoSetProxyBlanket((*pSvc), RPC_C_AUTHN_WINNT, RPC_C_AUTHZ_NONE, NULL, RPC_C_AUTHN_LEVEL_CALL, RPC_C_IMP_LEVEL_IMPERSONATE, NULL, EOAC_NONE);

    if (FAILED(hres))
    {
        cout << "Could not set proxy blanket. Error code = 0x" << hex << hres << endl;
        (*pSvc)->Release();
        (*pLoc)->Release();     
        CoUninitialize();
        return hres;
    }

    return hres;
}

HRESULT query(IWbemLocator** pLoc, IWbemServices** pSvc, IEnumWbemClassObject** pEnum, const char* qry)
{
    HRESULT hres;

    hres = (*pSvc)->ExecQuery(bstr_t("WQL"), bstr_t(qry), WBEM_FLAG_FORWARD_ONLY | WBEM_FLAG_RETURN_IMMEDIATELY, NULL, &(*pEnum));

    if (FAILED(hres))
    {
        cout << "Query for operating system name failed." << " Error code = 0x" << hex << hres << endl;
        (*pSvc)->Release();
        (*pLoc)->Release();
        CoUninitialize();
        return 1;
    }

    return hres;
}

HRESULT parse(IWbemLocator** pLoc, IWbemServices** pSvc, IEnumWbemClassObject** pEnum, IWbemClassObject** pCls, size_t n_args, ...)
{
    HRESULT hres;

    ULONG uReturn = 0;

    while (pEnum)
    {
        hres = (*pEnum)->Next(WBEM_INFINITE, 1, &(*pCls), &uReturn);

        if (0 == uReturn)
        {
            break;
        }

        VARIANT vtProp;

        va_list vl;
        va_start(vl, n_args);
        for (size_t i = 0; i < n_args; i++)
        {
            const char* name = va_arg(vl, const char*);

            int wchars_num =  MultiByteToWideChar(CP_UTF8, 0, name, -1, NULL, 0);
            wchar_t* wname = new wchar_t[wchars_num];
            MultiByteToWideChar(CP_UTF8 , 0, name, -1, wname, wchars_num);

            hres = (*pCls)->Get(wname, 0, &vtProp, 0, 0);
            wcout << wname << " : " << std::to_wstring((size_t)vtProp.bstrVal) << " : " << affinity((DWORD)vtProp.bstrVal) << endl;

            delete[] wname;
        }
        va_end(vl);

        VariantClear(&vtProp);
    }

    return hres;
}

int main(int argc, char **argv)
{
    string qry = "SELECT * FROM Win32_PerfFormattedData_PerfProc_Thread WHERE IDProcess = 7424";

    HRESULT hres;

    IWbemLocator* pLoc = NULL;
    IWbemServices* pSvc = NULL;

    IEnumWbemClassObject* pEnum = NULL;

    IWbemClassObject* pCls = NULL;

    hres = connect(&pLoc, &pSvc);
    if (FAILED(hres)) return 1;

    hres = query(&pLoc, &pSvc, &pEnum, qry.c_str());
    if (FAILED(hres)) return 1;

    hres = parse(&pLoc, &pSvc, &pEnum, &pCls, 1, "IDThread");
    if (FAILED(hres)) return 1;

    pSvc->Release();
    pLoc->Release();
    pEnum->Release();
    pCls->Release();
    CoUninitialize();

    return 0;   
}

Prime95 停止时的输出:

IDThread : 9072 : 15
IDThread : 7052 : 15

Prime95 使用 4 个工作线程运行时的输出:

IDThread : 9072 : 15
IDThread : 7052 : 15
IDThread : 5600 : 1
IDThread : 5888 : 2
IDThread : 2888 : 4
IDThread : 9348 : 8

PercentProcessorTime : 0
PercentProcessorTime : 0
PercentProcessorTime : 70
PercentProcessorTime : 83
PercentProcessorTime : 80
PercentProcessorTime : 75

Prime95 使用 2 个工作线程运行时的输出:

IDThread : 9072 : 15
IDThread : 7052 : 15
IDThread : 2352 : 15
IDThread : 8396 : 15

解释:

稍微解释一下代码:

  • 7424是 Prime95 的 PID。
  • SELECT * FROM Win32_PerfFormattedData_PerfProc_Thread WHERE IDProcess = 7424是我用来列出与特定 PID 相关的所有线程的查询。您可以从Win32_PerfFormattedData_PerfProc_Thread 这里找到所有信息的列表。您所要做的就是将给定的参数切换parse()为例如,ThreadID让我们说它PercentProcessorTime会输出 CPU 使用百分比。
  • 该代码非常丑陋并且可能不安全,它也是一个经过大量修改的示例:从 MSDN获取本地计算机的 WMI 数据。

亲和力:

该函数affinity()将线程关联设置为新的以获取旧的,然后将其设置回旧的。现在,我不确定如何从亲和力中获取实际的核心数,我所知道的是,例如,如果它1在核心 1 上运行,如果2它在核心 2 上运行,如果7它在核心 4 和 3 上运行或类似的规定。我还没有完全弄清楚。


将其移植到 linux:

在 linux 上,这一切都容易一些,例如可以使用sched_getcpu/之类的东西来获取核心sched_getaffinity。通过一些谷歌搜索,我相信您也可以找到一种方法来列出与进程关联的所有线程。

于 2013-05-29T15:45:37.063 回答