我不能使用 XPath,因为编码变得很奇怪。我希望你能帮我摆脱这个麻烦。
require "Nokogiri"
require "open-uri"
link = "http://www.arla.dk/Services/SearchService.asmx/RecipeResult?q=allRecipe&paging=6&include=&exclude=&area=recipeSearch&languageBranch=da"
doc = Nokogiri::HTML(open(link))
doc.xpath("//h2")
该xpath
方法返回一个空数组。看起来文档没有被正确解析。我认为这是由于正在解析的文件包含编码字符:
<strong>Frokost til 8</strong>
<ul><li class='ingHeading'><strong><b>Flade