我能够使用这个问题作为解析“mht”文件的起点,但是锚标签中的“3D”(例如<a href=3D"[my anchor]">[anchor text]></a>
:)破坏了所有内部链接和嵌入图像。我可以让解析器用“=”(例如:)替换“=3D” <a href="[my anchor]">[anchor text]></a>
,它似乎工作正常,但我想了解那个“元标记”的目的。
为什么从“.docx”导出到“.mht”会在大多数(如果不是全部)html 属性的右侧添加“3D”?是否有更好的方法来处理它们或替换它们时使用更好的正则表达式?