0

我的 Java 应用程序有问题。我有一个大文本,有时包括“ a ”、“ br ”和“ p ”html 标记。

文本需要通过谷歌翻译进行翻译。我被迫(!)进行翻译查询:

http://translate.google.com/m?hl=en&sl=auto&tl=" + tl + "&ie=UTF-8&prev=_m&q="+URLEncoder.encode(text);

现在我的问题是这些讨厌的标签。首先,我将所有链接替换为其文本类比:

text.replaceAll("<a (.*) href=\"(.*)\">(.*)</a>", "$2");

我的问题是:当我将此文本传递给 GT 时,它只是删除了所有链接,所以我没有返回文本链接,只有文本的其余部分。

如果我尝试使用NON -replaced 链接传递文本 - 如果链接 href 很长(如我的链接,因为它们很长)它只是将其完全裁剪掉,例如,

a href="AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAASDADSADSADSADASAAAAAAAAAAAADSADSADASDASDSA" 将转换为纯“a”(后面的所有内容均为空白)

我该怎么办?如何使其正常工作,以免打扰我在文本中的链接?

提前致谢!

PS我没有其他选择使用任何其他API,只能查询!

4

0 回答 0