我有以下字符串:
<A href="CarPage.asp?parent=CAR123+++&Color=RED">The Car is Red - Its Fast</a>
我想提取:
- CAR123
- 红色的
- 这辆车是红色的——它的速度很快
到目前为止,我所拥有的是:
(?<=<A href="CarPage\.asp\?parent=)[A-Za-z0-9]*(\+\+\+&Color=)[A-Za-z0-9]{3}(\">)[A-Za-z0-9\- ]*(?=</a>)
但是当它们不在字符串边界上时,我不确定如何设置正负前瞻和后视。
我知道,它是 HTML……我以前听说过……“不要用正则表达式解析 html……”我不需要比这更详细的东西了。
帮助表示赞赏。
谢谢!