我在弄清楚为什么 HXT 正在取代我的 DTD 时遇到了一些麻烦。首先,这是我要解析的输入文件:
<!DOCTYPE html>
<html>
<head>
<title>foo</title>
</head>
<body>
<h1>foo</h1>
</body>
</html>
这是我得到的输出:
<?xml version="1.0" encoding="US-ASCII"?>
<html>
<head>
<title>foo</title>
</head>
<body>
<h1>foo</h1>
</body>
</html>
最后,这是我正在使用的箭头的简化版本:
start (App src dest) = runX $
readDocument [ withValidate no
, withSubstDTDEntities no
, withParseHTML yes
--, withTagSoup
]
src
>>>
this
>>>
writeDocument [ withIndent yes
, withSubstDTDEntities no
, withOutputHTML
--, withOutputEncoding "UTF-8"
]
dest
对于这些评论,我深表歉意——我一直在玩弄不同的配置组合。我似乎无法让 HXT不与 DTD 混淆,即使使用withSubstDTDEntities no
,withValidate no
等。我收到警告说 HXT 忽略了我的 doctype 声明,但这是我仅有的一点见解。谁能帮我一把?先感谢您!