我有一些非常简单的 HTML,我正在尝试使用 Nokogiri(在 Ruby 上)解析:
<span>Address</span><br />
123 Main Street<br />
Sometown<br />
<span>Telephone</span><br />
<a href="tel:212-555-555">212-555-555</a><br />
<span>Hours</span><br />
M-F: 8:00-21:00<br />
Sat-Sun: 8:00-21:00<br />
<hr />
我唯一的标签是<div>
页面内容的周围。我想要的每一件事前面都有一个<span>Address</span>
类型标签。它后面可以跟 anotherspan
或 ahr
结尾。
我想将地址(“123 Main Street\nSometown”)、电话号码(“212-555-555”)和营业时间作为单独的字段结束。
有没有办法使用 Nokogiri 获取信息,或者使用正则表达式更容易做到这一点?