我需要title
从文件中提取段落(如在 StackOverflow 中)html
。
我可以使用 Java 中的正则表达式来提取我需要的字段,但我必须得到decode
这些字段。
例子
提取的字段:
Paging Lucene's search results (with **;** among **'** and **s**)
解码后的字段:
Paging Lucene's search results
java中是否有任何类可以让我转换这些html代码?