编写程序来解析来自一个网站的一些数据,使用AngleSharp
. 不幸的是,我没有找到任何文档,这让我很难理解。
- 如何使用
QuerySelectorAll
仅获取链接?我现在得到了所有<a ...>...</a>
的东西Name of article
。
<a href="http://kinnisvaraportaal-kv-ee.postimees.ee/muua-odra-tanaval-kesklinnas-valmiv-suur-ja-avar-k-2904668.html?nr=1&search_key=69ec78d9b1758eb34c58cf8088c96d10" class="object-title-a text-truncate">1. Name of artucle</a>
我现在使用的方法:
var items = document.QuerySelectorAll("a").Where(item => item.ClassName != null && item.ClassName.Contains("object-title-a text-truncate"));
- 在前面的示例中,我也使用了 ClassName.Contains("object-name"),但是如果我们处理表格单元格,则没有任何类。据我所知,要解析正确的元素,我还必须使用一些关于父级的信息。所以这里有一个问题,我怎样才能从表格单元格中获得这个“4”值?
………… <th class="strong">Room</th>
<td>4</td>
_