我知道不用于解析RegEx
是公众舆论;但是,对于我想要实现的目标,我看不到使用(在以前的使用中添加了类似的功能,例如in )会有什么害处。 HTML
RegEx
Scripting Languages
RegEx
_StringBetween( )
AutoIt3
我也知道这_StringBetween( )
不是专门为它编写的,但在过去的 8 年里,HTML
我一直在与其他人一起使用它,在内容上没有任何问题。HTML
对于我来说HTML Extraction API
,我想介绍以下内容HTML
<div class="video" id="video-91519"><!-- The value of the identifier is dynamic-->
<a href="about:blank"><img src="silly.jpg"><!-- So is the href and src in a, img -->
</div>
API
我试图写的原因是为了使提取video_url
和thumbnail
非常容易,因此HTML parser
似乎遥不可及。我希望能够使用以下内容提取它
<div class="video" id="video-{{unknown}}">{{unknown}}<a href="{{video_url}}"><img src="{{thumbnail}}">{{unknown}}</div>
当然,在上一篇中,HTML
你可以更容易地做到这一点,例如
<a href="{{video_url}}"><img src="{{thumbnail}}">
但我试图提供一个完美的例子以避免混淆。
怎么RegEx
上场?好吧,我打算用 和 替换和,当然还要{{video_url}}
确保在提供的输入(不是)中没有多次出现and 。{{thumbnail}}
{{unknown}}
(.*?)
(.*?)
.*
/s
{{video_url}}
{{thumbnail}}
HTML
那么,我有什么理由不使用RegEx
或仍然选择HTML parser
包含。RegEx
可接受和/或使用的概念证明HTML parser
?我个人无法看到如何使用HTML parser