我为 html 构建了一个解析器,但我假设它会遵循只有两种形式的规则:
<foo> </foo>
<foo/>
显然这是错误的。诸如 , 和 之类的标签base
不需要meta
这个link
。我有点希望不是这样,因为我在脚本中发现了这样的东西:
for(var d=b.length,e=b[a];a<d>>1;)
哦,看,神话般的<d>
标签。
所以我需要让自己成为一个要忽略的标签白名单。是否有不需要固相线或结束标签的标签的完整列表?如果没有,我将不得不重写我的解析器。
谢谢