我正在尝试抓取以下网站,因为 XML 格式错误并且不包含我需要的所有数据:
http://www.cafebonappetit.com/menu/your-cafe/pitzer
但是,当我使用 Mechanize 获取文档时,我只得到:
{meta_refresh}
{title "Collins  | Claremont McKenna Cafés | Café Bon Appétit"}
{iframes}
{frames}
{links
 #<Mechanize::Page::Link "Welcome" "http://www.cafebonappetit.com/">
 #<Mechanize::Page::Link "Our Approach" "javascript://">
 #<Mechanize::Page::Link
 "Kitchen Principles"
 "http://www.cafebonappetit.com/our-approach/kitchen-principles">
 .....
 }
不幸的是,我显然需要了解表格中的内容(我猜它们是 iFrame)。有什么想法吗?
谢谢!