我正在尝试提取一段嵌套在 html 代码<span class="code">
和</span>
. 这个想法是我需要存储在它们之间的信息。
如何自动从网页中提取这些信息?
我会假设你是用 Ruby 或 Javascript 来做的,因为你没有指定,而这些是我知道如何最好地做到这一点的语言。
在 Ruby 中,您首先需要通过以下方式安装Nokogiri gem
gem install nokogiri
你的代码看起来像这样:
require 'nokogiri'
require 'open-uri'
doc = Nokogiri::HTML(open('http://your-url.example.com/foo/bar))
value = doc.css('span.code');
p value
对于 Javascript,您可以使用 jQuery(不知道怎么做)。
var value = $('span.code').value;