我觉得我在这里遗漏了一些微妙的东西。
我有一个$doc
我可以看到的$doc asText
真正包含要解析的页面的内容。它来自dom parse -html5 $body
.
从这里开始,我想以交互方式探索 DOM。例如,获取锚点列表。似乎$doc selectNodes {//a}
可以工作*,但这不会返回任何东西。我也没有尝试其他任何东西selectNodes
(/head,/body,/html ...什么都没有!)。我可以看到那里childNodes
的结构似乎完好无损。
探索这些节点的更好方法是什么,以便我找出问题所在?
- https://wiki.tcl-lang.org/page/XPath - 这就是我想要遵循的