4

可能重复:
UTF8 到/从 STL 中的宽字符转换

我知道如何使用MultiByteToWideChar将 UTF8 转换为 std::wstring :

std::wstring utf8to16( const char* src )
{
    std::vector<wchar_t> buffer;
    buffer.resize(MultiByteToWideChar(CP_UTF8, 0, src, -1, 0, 0));
    MultiByteToWideChar(CP_UTF8, 0, src, -1, &buffer[0], buffer.size());
    return &buffer[0];
}

但它是特定于 Windows 的,是否有一个跨平台的 C++ 函数可以做同样的事情,只使用 stdio 或 iostream?

4

1 回答 1

3

我建议使用utf8-cpp 库,它很简单,而且涉及到 utf8 字符串。

此代码读取 UTF-8 文件并为每一行创建一个 utf16 版本,然后转换回 utf-8

#include <fstream>
#include <iostream>
#include <string>
#include <vector>
#include "utf8.h"
using namespace std;
int main(int argc, char** argv)
{
    if (argc != 2) {
        cout << "\nUsage: docsample filename\n";
        return 0;
    }

    const char* test_file_path = argv[1];
    // Open the test file (contains UTF-8 encoded text)
    ifstream fs8(test_file_path);
    if (!fs8.is_open()) {
        cout << "Could not open " << test_file_path << endl;
        return 0;
    }

    string line;
    while (getline(fs8, line)) {

        // Convert the line to utf-16
        vector<unsigned short> utf16line;
        utf8::utf8to16(line.begin(), end_it, back_inserter(utf16line));

        // And back to utf-8
        string utf8line; 
        utf8::utf16to8(utf16line.begin(), utf16line.end(), back_inserter(utf8line));
    }
    return 0;
}
于 2013-01-30T12:26:32.637 回答