很久以前,我写了一个样式“规范器”程序来扫描一大堆经典 ASP 页面的 ASP/HTML 代码(其中大部分最初是从 MS-Word 文档生成的,所以自然而然地到处都是多余的样式表和大量的样式表) -off 样式)。样式规范器生成了一组最小的样式表和样式以及一个新的“净化”asp/html 文档,因此净化后的文档产生与原始文件完全相同的渲染输出(通过屏幕截图图像比较验证)。
时不时地,我遇到对这样一个程序的需求,并且正在考虑编写一个用于商业发布的想法。
我的谷歌搜索技能并没有完全像这样出现(HTML:Normalize Perl 模块和 HTML Tidy 项目似乎只是清理标签)。
所以,我的问题是:
- 是否已经有这样的工具,商业或其他?
- 如果没有,真的有人需要吗?
- 如果是这样,哪些功能会让它真正值得?
例如,关于#3,为一组页面收集基本样式表,或调整所有页面以使用给定的基本样式表;保留经典的 asp 命令,遵循#includes,保留 asp.net 嵌入式脚本等。越具体、越多越好。
示例:
带有嵌入标签的旧 html
<html><head>
<title>title</title>
<style type='css/text'>
.cls1 { font-family: arial; font-size: 10px; font-weight: bold; }
</style>
</head>
<body>
<% somefunction() %>
<div class='cls1' style='font-size:10px;'>test div</div>
</body>
</html>
新的 html
<html><head>
<title>title</title>
<style type='css/text'>
.cls1 { font-family: arial; font-size: 10px; font-weight: bold; }
</style>
</head>
<body>
<% somefunction() %>
<div class='cls1'>test div</div>
</body>
</html>
请注意,div 上的样式已经消失,因为它与 cls1 类是多余的
编辑:删除了“消毒剂”一词,因为我不专注于 XSS 攻击或过滤评论中的输入,而只是将许多临时样式和随机 CSS 类整合到一组最小的连贯样式表中。