我之前问过一个类似的问题,推荐 Nokogiri 作为解决方案。我用过Nokogiri,它确实工作得很好。
但由于某些原因,我必须使用正则表达式从 HTTP 响应正文中提取关键字。
关键字格式如下:
<HTML>
<HEAD> <TITLE>TestExample [Date]</TITLE></HEAD>
</HTML>
这里,Date
是一个动态变量,我需要TestExample [Date]
从 HTTP 响应正文中提取 ' '。此外,<title>
可以是小写或大写。
假设“响应”具有 http 响应,我尝试执行以下操作:
>> response
=> "<HTML>\n<HEAD> <TITLE>TestExample [Date]</TITLE></HEAD>\n</HTML>"
然后做一个正则表达式来搜索:
>> regex
=> /<title>TestExample (.*?)<\/title>/mi
当我做 aresponse[regex]
时没有结果。response.match(regex)
和没有结果response.scan(regex)
。
如何使用 regex完成此任务?
更新:
对于此任务,此正则表达式可以正常工作:
response.match(/<title>(.*)<\/title>/mi).captures.first