我正在尝试使用 Ruby 和 Nokogiri 抓取一个包含大约 10 列的页面,其中大多数列都非常简单,因为它们具有唯一的类名。但是,其中一些具有类 id,似乎在标准类名称后面附加了长数字字符串。
例如,比赛时间都用 来表示.eventLine-time
,球队名称用 来.team-name
表示,但是这个特定的有,例如:
<div class="eventLine-book-value" id="eventLineOpener-118079-19-1522-1">-3 -120</div>
.eventLine-book-value
不特定于此列,因此没有用处。每场比赛的 13 位数字都是不同的,尝试如下:
def nodes_by_selector(filename,selector)
file = open(filename)
doc = Nokogiri::HTML(file)
doc.css(^selector)
end
给我留下了错误。我已经看到 ^ 和 ~ 在其他语言中使用,但我是新手,我尝试寻找方法来获取所有数据id=eventLineOpener-XXXX
,但无济于事。