2

我正在尝试解析一些日文文本,但我似乎无法弄清楚输出编码。

这是我得到的输出:

これは ̾��,����,*,*,*,*,*
本   ̾��,����,*,*,*,*,*
です  ̾��,����,*,*,*,*,*
。   ̾��,������³,*,*,*,*,*
EOS

我采取的步骤:

  1. git clone https://github.com/taku910/mecab
  2. cd mecab/mecab
  3. ./configure --enable-utf8-only --with-charset=utf8
  4. make
  5. sudo make install
  6. mecab -o ~/Desktop/output.txt ~/Desktop/input.txt,其中input.txt包含“これは本です。”

使用 OSX 10.15.3

4

0 回答 0