我需要从 R 中使用 htmlParse (package: XML) 的 html 文档中抓取以下文本:
<h1 class="IT">
<span class="f" id="hotel">HOTEL</span>
<span class="nowrap">
<i class="b stars ratings_stars_5 star_track" data-track-on-mouseover=""></i>
</span>
</span>
</h1>
我正在使用此代码(代码示例)来抓取酒店的名称。但是,我需要添加酒店的评级:
for (i in seq_len(3)){
txt <- getURL(url=baseURL[i], followlocation = TRUE, encoding="UTF-8")
doc <- htmlParse(txt)
hotel <- cssApply(doc, ".details>h3", cssCharacter)
hotel <- cssApplyInNodeSet(doc, ".details", "h3", cssCharacter)
data <- cbind(hotel)
}