我知道不用于解析RegEx是公众舆论;但是,对于我想要实现的目标,我看不到使用(在以前的使用中添加了类似的功能,例如in )会有什么害处。 HTMLRegExScripting LanguagesRegEx_StringBetween( )AutoIt3
我也知道这_StringBetween( )不是专门为它编写的,但在过去的 8 年里,HTML我一直在与其他人一起使用它,在内容上没有任何问题。HTML
对于我来说HTML Extraction API,我想介绍以下内容HTML
<div class="video" id="video-91519"><!-- The value of the identifier is dynamic-->
<a href="about:blank"><img src="silly.jpg"><!-- So is the href and src in a, img -->
</div>
API我试图写的原因是为了使提取video_url和thumbnail非常容易,因此HTML parser似乎遥不可及。我希望能够使用以下内容提取它
<div class="video" id="video-{{unknown}}">{{unknown}}<a href="{{video_url}}"><img src="{{thumbnail}}">{{unknown}}</div>
当然,在上一篇中,HTML你可以更容易地做到这一点,例如
<a href="{{video_url}}"><img src="{{thumbnail}}">
但我试图提供一个完美的例子以避免混淆。
怎么RegEx上场?好吧,我打算用 和 替换和,当然还要{{video_url}}确保在提供的输入(不是)中没有多次出现and 。{{thumbnail}}{{unknown}}(.*?)(.*?).*/s{{video_url}}{{thumbnail}}HTML
那么,我有什么理由不使用RegEx或仍然选择HTML parser包含。RegEx可接受和/或使用的概念证明HTML parser?我个人无法看到如何使用HTML parser