Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有一些带有很多标签的网页。我想下载它标签所在的源页面,Span它className是Something。
Span
className
Something
我可能只是下载页面的一部分(源代码)而不是整个页面?
我知道我可以做到这一点webbrowser(例如导航到我的目标页面并搜索特定标签并获取其源代码)但是有了它,我必须首先获取整个页面,然后再获取特定标签。
webbrowser
有什么方法(例如:WebClient类)可以只下载带有特定ClassName源代码的特定标签吗?
WebClient
ClassName
不,HTTP 协议没有任何设施来做你需要的事情(唯一能做的就是获得某个 Range,但这需要你确切知道数据在哪里,所以这似乎没有帮助) ,您必须下载整个页面,然后解析您需要的内容。
恐怕您不能只下载部分页面,而需要先加载整个页面。但是为了使它更容易,您可以在 XML 中解析 HTML,然后使用它,这要容易得多。