通过该代码,我从 html 文档中提取了所有需要的文本
private void RunThroughSearch(string url)
{
private IWebDriver driver;
driver = new FirefoxDriver();
INavigation nav = driver.Navigate();
nav.GoToUrl(url);
var div = driver.FindElement(By.Id("results"));
var element = driver.FindElements(By.ClassName("sa_wr"));
}
虽然我需要细化提取文档的结果
Container
HEADER -> Title of a given block
Url -> Link to the relevant block
text -> body of a given block
/Container
正如您在我的代码中看到的那样,我能够将文本部分的值作为文本值获取,这很好,但是如果我想将容器的值作为HTML而不是提取的文本呢?
<div class="container">
<div class="Header"> Title...</div>
<div class="Url"> www.example.co.il</div>
<div class="ResConent"> bla.. </div>
</div>
所以容器在一个页面中大约有 10 次我需要提取它的 innerHtml 。
有任何想法吗 ?(使用硒)