我正在尝试标记由 UTF-8 字符组成的输入。虽然有些人尝试学习 utf8,但我得到了一个我无法理解的输出。当我输入字符 π (pi) 时,我得到三个不同的数字 207 128 10。我如何使用它们来控制它属于哪个类别?
ostringstream oss;
oss << cin.rdbuf();
string input = oss.str();
for(int i=0; i<input.size(); i++)
{
unsigned char code_unit = input[i];
cout << (int)code_unit << endl;
}
提前致谢。