python - 使用 Python 将日语翻译成英语

Question

我正在使用 Python 编写一些集成两个系统的脚本。系统扫描邮箱并搜索特定主题行，然后解析电子邮件中的信息。我正在寻找的元素之一是 HTML 链接，然后我使用 Curl 将 html 代码以文本格式写入文本文件。

我的问题是，如果电子邮件中的文本是日语，那么 Python 中是否有任何模块可以自动将该文本转换为英语？还是我将字符串转换为Unicode，然后对其进行解码？

这是我所看到的一个例子。当我使用 curl 从 URL 中获取文本时：

USB Host Stack 処理において解放されたメモリを不正に使用している

当我做一个简单的 re.match 来获取字符串并将其写入文件时，得到这个：

USB Host Stack æQtk0J0D0f0ã‰&gt;eU0Œ0_0á0â0ê0’0Nckk0O(uW0f0D0‹0

当我使用电子邮件模块获取电子邮件时，我也会收到以下信息

>>> emailMessage.get_payload()
USB Host Stack =E5=87=A6=E7=90=86=E3=81=AB=E3=81=8A=E3=81=84=E3=81=A6=E8=A7=
=A3=E6=94=BE=E3=81=95=E3=82=8C=E3=81=9F=E3=83=A1=E3=83=A2=E3=83=AA=E3=82=92=
=E4=B8=8D=E6=AD=A3=E3=81=AB=E4=BD=BF=E7=94=A8=E3=81=97=E3=81=A6=E3=81=84=E3=
=82=8B

所以，我想我真正的问题是我必须采取哪些步骤才能将其正确转换为英语。我真的很想拿第一个是日文字符并将其转换为英文。

score 0 · Accepted Answer

正如其他人所写，自然语言翻译是一个非常具有挑战性的问题。因此，请考虑将要翻译的字符串发送到服务，例如谷歌翻译，它会为您翻译它们（很糟糕，但总比没有好）并将它们发送回去。

以下 SO 链接显示了一种方法：translate url with google translate from python script

在你让它工作之前，你应该解决你的编码问题（unicode、uuencoding 等），这样你就可以在不破坏文本的情况下读写文本。

python - 使用 Python 将日语翻译成英语

1 回答 1

Related

Reference