最近我对网页抓取感到“有趣”。我想使用的网站没有 API,所以我别无选择,我必须这样做。
我遇到的问题之一是阅读 HTML 树的元素(我的意思是标签、内部文本和类似的东西)。我使用HttpWebRequest
andHttpWebResponse
向服务器发送GET/POST请求。
让webResponse
我可以通过这种方式阅读 HTML 源代码:
StreamReader sr = new StreamReader(webResponse.GetResponseStream(), Encoding.UTF8);
string sourceCode = sr.ReadToEnd();
我需要的是value
这个input
标签:
<form action="/file.php" method="post">
<input name="abc" id="abc" type="hidden" value="some_random_value" />
</form>
我怎样才能做到这一点?