我尝试从 JTextPane 获取漂亮(干净的)文本内容。这是来自的示例代码JTextPane
:
JTextPane textPane = new JTextPane ();
textPane.setContentType ("text/html");
textPane.setText ("This <b>is</b> a <b>test</b>.");
String text = textPane.getText ();
System.out.println (text);
文本如下所示JTexPane
:
这是一个测试。
我得到这种打印到控制台:
<html>
<head>
</head>
<body>
This <b>is</b> a <b>test</b>.
</body>
</html>
我已经使用substring()
和/或replace()
代码,但使用起来不舒服:
String text = textPane.getText ().replace ("<html> ... <body>\n , "");
是否有任何简单的功能可以<b>
从字符串中删除除标签(内容)之外的所有其他标签?
有时在内容周围JTextPane
添加<p>
标签,所以我也想摆脱它们。
像这样:
<html>
<head>
</head>
<body>
<p style="margin-top: 0">
hdfhdfgh
</p>
</body>
</html>
我只想获取带有标签的文本内容:
This <b>is</b> a <b>test</b>.