1

我想使用 Java 解码从网站的 HTTP GET 请求中获得的以下字符串:

  • Ö
  • '
  • ü

(其实我得把它们放到代码博客里,Stackoverflow 会自动解码它们,我希望我能做得太早;))

这些相等(我想被解码)

  • Ö
  • '
  • ü

我怎样才能解码它们?我尝试了 Apache Commons 语言:

StringEscapeUtils.unescapeHtml4(string);

它可以转换'但不能转换其他的(德国特殊字符)。

你有想法吗?我找到了它的在线解码器(如http://rishida.net/tools/conversion/),但我找不到任何有效的功能......

4

2 回答 2

1

您可以为此使用JSoup

import org.jsoup.Jsoup;
...
String parsed = Jsoup.parse("Ö'ü").text();
System.out.print(parsed);  // prints Ö'ü
于 2013-10-26T14:42:01.167 回答
1

我发现它为什么不起作用。我的 java 文件没有保存为 UTF-8 编码。要在 Eclipse 中设置它,您必须转到 General -> Workspace -> Text file encoding -> Other并选择UTF-8

文本编码设置

在此之后,Apache Commons LangJSoup正在工作。

于 2013-10-26T14:54:31.720 回答