linux - 用于设置 MIME 类型的 xgettext、msginit、msgfmt 序列的命令或选项？

Question

通过手动编辑模板文件中的 MIME Content-Type 字符集来更正波兰文本上的 msgfmt“无效多字节序列”错误。是否有一些用于设置 MIME 类型的 xgettext、msginit、msgfmt 序列的命令或选项？

cat >plt.cxx <<EOF
// plt.cxx
#include <libintl.h>
#include <locale.h>
#include <iostream>
int main (){
    setlocale(LC_ALL, "");
    bindtextdomain("plt", ".");
    textdomain( "plt");
    std::cout << gettext("Invalid input. Enter a string at least 20 characters long.") << std::endl;
}
EOF
g++ -o plt plt.cxx
xgettext --package-name plt --package-version 1.2 --default-domain plt --output plt.pot plt.cxx
sed --in-place plt.pot --expression='s/CHARSET/UTF-8/'
msginit --no-translator --locale pl_PL --output-file plt_polish.po --input plt.pot
sed --in-place plt_polish.po --expression='/#: /,$ s/""/"Nieprawidłowo wprowadzone dane. Wprowadź ciąg przynajmniej 20 znaków."/'
mkdir --parents ./pl_PL.utf8/LC_MESSAGES
msgfmt --check --verbose --output-file ./pl_PL.utf8/LC_MESSAGES/plt.mo plt_polish.po
LANGUAGE=pl_PL.utf8 ./plt

score 10 · Accepted Answer

只需提供完整的语言环境名称，msginit 就会正确设置字符集

msginit --no-translator --input=xx.pot --locale=ru_RU.UTF-8

结果是

"Language: ru\n"
"Content-Type: text/plain; charset=UTF-8\n"

score 8 · Accepted Answer

直接设置输出字符编码没有参数，但这在实践中应该不是问题，因为您的 PO 编辑器在保存 PO 文件时会自动使用适当的字符编码（支持翻译中使用的所有字符的编码） , 并CHARSET在文件中替换为编码的名称。如果没有，请提交错误。

唯一的问题是 POT 文件是否包含非 ASCII 字符，但xgettext 确实有一个--from-code参数，它指定输入文件的编码。如果输入包含非 ASCII 字符并--from-code设置为正确的编码，则输出 POT 文件将字符编码设置为 UTF-8（这不必等于输入字符编码）。但是，如果输入文件只包含 ASCII 字符，--from-code=UTF-8将很遗憾没有任何效果。

msginit事实上，它会自动将字符编码设置为适合所选目标语言环境的“适当”值。但是，字符编码对的语言环境列表似乎已经过时了。UTF-8 现在确实是所有语言的最佳选择。

另一种方法是使用pot2po而不是msginit. 这总是自动使用 UTF-8，AFAICS。但是，与不同msginit的是，它不会自动填写 PO 文件的复数形式，这可能有问题，也可能没有问题（有人认为这是 PO 编辑器的工作）。

linux - 用于设置 MIME 类型的 xgettext、msginit、msgfmt 序列的命令或选项？

2 回答 2

Related

Reference