尽管我的 C++ 经验已大大减少,但我正在尝试帮助 C++ 程序员让他的库在 Mac 上运行。目前,问题似乎仅与语言环境/编码有关。
为了创建一个最小的工作示例,我测试了以下代码,它将一行 UTF-8 字符读取为一个宽字符串 (wstring),然后遍历该字符串并打印每个字符。
虽然它在 Linux 机器上完美运行,所有字符都打印在不同的行中,但在使用 Mac 机器时,我每行打印每个字节(而不是每个字符)。
代码是:
#include <sstream>
#include <iostream>
#include <string>
#include <boost/locale.hpp>
using namespace std;
int main() {
std::ios_base::sync_with_stdio(false);
boost::locale::generator gen;
locale mylocale = gen("pt_PT.UTF-8");
locale::global(mylocale);
wstring userInput;
getline(wcin, userInput);
wcerr << "Size of string is " << userInput.length() << endl;
for (int i = 0; i < userInput.length(); ++i) {
wcerr << userInput.at(i) << endl;
}
return 0;
}
我的测试字符串是一个愚蠢的葡萄牙语句子:
O coração é um órgão frágil.
我正在尝试使用 Boost_locale,因为有人告诉我这是让 unicode 在 Mac 上正常工作的方法,但我很高兴有一个仅使用 C++ 标准库的解决方案。
编辑:
以下代码适用于 Mac。由于包含 codecvt,它无法在我的 Linux 机器上编译,但我可以通过一些 CPP 指令来管理它。
#include <sstream>
#include <iostream>
#include <fstream>
#include <codecvt>
#include <locale>
#include <string>
using namespace std;
int main() {
// setting std::local::global seems not to work (??)
wcin.imbue(std::locale(locale(""), new std::codecvt_utf8<wchar_t>));
wcerr.imbue(std::locale(locale(""), new std::codecvt_utf8<wchar_t>));
wstring userInput;
getline(wcin, userInput);
wcerr << "Size of string is " << userInput.length() << endl;
for (int i = 0; i < userInput.length(); ++i) {
wcerr << userInput.at(i) << endl;
}
return 0;
}