2

有人可以帮我提取字符串:

Advice about something

从下面:

<TITLE>Advice about something</TITLE>

该表达式应该能够捕获 和 之间的<TITLE>字符串</TITLE>。我尝试了诸如 之类的表达式[^TITLE<g\/],但无法获得正确的输出。

4

3 回答 3

5

如果您想要一个强大的解决方案而不是临时破解,那么请使用特定的解析器。

require "cgi"
require "nokogiri"
Nokogiri.parse(CGI.unescapeHTML(
  "<TITLE>Advice about something</TITLE>"
))
.xpath("TITLE").text
# => "Advice about something"
于 2013-07-09T12:26:18.563 回答
1

取左边部分<TITLE>和右边部分</TITLE>,放在(.*?)中间:
<TITLE>(.*?)<\/TITLE>

在线演示

于 2013-07-09T12:00:24.340 回答
0

要看。字符串是否总是由半列分隔?

tmp = "<TITLE>Advice about something</TITLE>"
=> "<TITLE>Advice about something</TITLE>" 

tmp.split(';')[2].gsub(/\&lt/, "")
=> "Advice about something"
于 2013-07-09T12:23:23.353 回答