目前我正在学习正则表达式,有很多东西我不明白。
我有一个带有表格的网站,我想在其中提取项目。其中一列可以包含固定值(在此示例中为“foo”)或不包含任何内容,其他列始终包含一些数据。它们的提取效果很好,但特殊列中的可选内容却没有。因此我使用类似的表达式
<a id=x .*?>(.*?)</a>.*?<a id=y .*?>(.*?)</a>
我的实际问题是最终表达式的以下部分
... .*?(foo)?.*? ...
这应该实现在其他单元格之间有一个内容为 foo 的单元格,它可能会丢失并且只有在它存在时才应该返回。我究竟做错了什么?一些基本的了解?