我在用 DOMXpath 抓取一个表格重的页面时遇到了一些问题。
布局真的很丑,这意味着我试图从表格中的表格中获取内容。使用 Firebug FirePath 我为表格元素获取以下路径:
html/body/table/tbody/tr[3]/td/table[1]/tbody/tr[2]/td[1]/table[1]/tbody/tr[3]/td[4]
现在,经过无休止的实验,我发现,对于独立的桌子,我需要删除“tbody”标签才能使其工作。但这对于表中的表来说似乎还不够。所以我的问题是如何最好地从表中表中的表中获取内容?
我上传了我想在这里抓取的文件:1