2

我正在使用 itext 从 html 内容创建 pdf。我使用 java String buffer 以表格的形式构建 html 内容。Map 以键值对的形式包含文件的元数据值。我迭代这些键和值来构建 html 表。问题是地图中的一些元数据值是无意义/无效的符号。因此 pdf 创建失败并出现以下异常。

java.io.IOException: Expected > for tag: <{1}/> near line 1, column 717
at com.lowagie.text.xml.simpleparser.SimpleXMLParser.throwException(SimpleXMLParser.java:568)
    at com.lowagie.text.xml.simpleparser.SimpleXMLParser.go(SimpleXMLParser.java:331)
    at com.lowagie.text.xml.simpleparser.SimpleXMLParser.parse(SimpleXMLParser.java:579)
    at com.lowagie.text.html.simpleparser.HTMLWorker.parse(HTMLWorker.java:141)


Content which caused the exception is 
“$é6莚ÆuCÅ ©À SÀF;r 1Ì/XQ‡,Ô<ÒÐ"‡(¢ËÄòÅ1¡Ø€ÌÅc

所以我的问题是这些字符是什么(非Ascii,不支持utf)?在构建 html 时有什么方法可以识别和跳过它们吗?

4

1 回答 1

2

实时构建HTML时很难识别和跳过您可以使用Apache commons-lang来转义HTML

StringEscapeUtils.escapeHtml("“$é6莚ÆuCÅ ©À SÀF;r 1Ì/XQ‡,Ô<ÒÐ"‡(¢ËÄòÅ1¡Ø€ÌÅc")

上面的输出是

&ldquo;$&eacute;6&egrave;&#381;&scaron;&AElig;uC&Aring; &copy;&Agrave; S&Agrave;F;r 1&Igrave;/XQ&Dagger;,&Ocirc;&lt;&Ograve;&ETH;&quot;&Dagger;(&cent;&Euml;&Auml;&ograve;&Aring;1&iexcl;&Oslash;&euro;&Igrave;&Aring;c
于 2014-09-26T10:36:57.417 回答