是否可以从 python 访问 html 元素的 data-* 部分?我正在使用 scrapy 并且 data-* 在选择器对象中不可用,尽管原始数据在 Request 对象中可用。
如果我使用转储 html,wget -O page http://page.com
那么我可以看到文件中的数据。有点像<a href="blah" data-mine="a;slfkjasd;fklajsdfl;ahsdf">blahlink</a>
我可以在编辑器中编辑该data-mine
部分,所以我知道它就在那里……似乎表现良好的解析器正在删除它。
如您所见,我很困惑。