好的,这就是我正在做的。我正在为以我的自定义扩展名(.cpm)结尾的文档制作 perl 解释器。我环顾四周,发现
- http://perlmeme.org/tutorials/html_parser.html
- https://metacpan.org/pod/HTML::TokeParser::Simple
- http://www.justskins.com/forums/html-parser-8489.html
似乎HTML::Parser是要走的路。我要的是一个简单的教程来解析带有特殊标签的文档。例如,我想要一些向我展示如何解析 HTML 文档的东西,但每当<putinbold>
遇到它时,它都会将其替换为<b>
.
我想要的一个例子-
<html>
This is HTML talking
<liamslanguage>say "This is Liams language speaking"</liamslanguage>
</html>