我的 Java 应用程序有问题。我有一个大文本,有时包括“ a ”、“ br ”和“ p ”html 标记。
文本需要通过谷歌翻译进行翻译。我被迫(!)进行翻译查询:
http://translate.google.com/m?hl=en&sl=auto&tl=" + tl + "&ie=UTF-8&prev=_m&q="+URLEncoder.encode(text);
现在我的问题是这些讨厌的标签。首先,我将所有链接替换为其文本类比:
text.replaceAll("<a (.*) href=\"(.*)\">(.*)</a>", "$2");
我的问题是:当我将此文本传递给 GT 时,它只是删除了所有链接,所以我没有返回文本链接,只有文本的其余部分。
如果我尝试使用NON -replaced 链接传递文本 - 如果链接 href 很长(如我的链接,因为它们很长)它只是将其完全裁剪掉,例如,
a href="AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAASDADSADSADSADASAAAAAAAAAAAADSADSADASDASDSA" 将转换为纯“a”(后面的所有内容均为空白)
我该怎么办?如何使其正常工作,以免打扰我在文本中的链接?
提前致谢!
PS我没有其他选择使用任何其他API,只能查询!