问题标签 [anglesharp]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - 使用 AngleSharp 解析
编写程序来解析来自一个网站的一些数据,使用AngleSharp
. 不幸的是,我没有找到任何文档,这让我很难理解。
- 如何使用
QuerySelectorAll
仅获取链接?我现在得到了所有<a ...>...</a>
的东西Name of article
。
<a href="http://kinnisvaraportaal-kv-ee.postimees.ee/muua-odra-tanaval-kesklinnas-valmiv-suur-ja-avar-k-2904668.html?nr=1&search_key=69ec78d9b1758eb34c58cf8088c96d10" class="object-title-a text-truncate">1. Name of artucle</a>
我现在使用的方法:
- 在前面的示例中,我也使用了 ClassName.Contains("object-name"),但是如果我们处理表格单元格,则没有任何类。据我所知,要解析正确的元素,我还必须使用一些关于父级的信息。所以这里有一个问题,我怎样才能从表格单元格中获得这个“4”值?
………… <th class="strong">Room</th>
<td>4</td>
_
c# - 缺少 Anglesharp 元素扩展
我已经更新到 Anglesharp Nuget 库 v.0.9.9 的最新版本。我可以在 Github 页面https://github.com/AngleSharp/AngleSharp/commit/7af0ef9c3cfd3d96803fa6ccff326f186744c99c上看到 Anglesharp 为元素相关方法添加了扩展。但是我无法使用我引用的 Anglesharp DLL 访问那些。
知道如何启用或访问这些吗?
c# - AngleSharp OpenAsync 返回空体
尝试使用 AngleSharp 解析 HTML 并遇到https://opensource.org/licenses/MS-PL的问题
以下代码在 Linqpad 中运行时返回“0”
我希望完整的 HTML 会作为正文的一部分返回。有任何想法吗?
c# - 使用 HttpClientHandler 设置超时
我正在尝试使用 HttpClientHandler 设置anglesharp.io 的超时值。
这个问题表明它是可能的:https ://github.com/AngleSharp/AngleSharp/issues/266
我得到这样的页面:
我看不到任何可用于设置超时的属性。如何设置超时?
anglesharp - LoaderService 去哪儿了?
将 AngleSharp 从 0.9.6 升级到 0.9.9 我这行代码不再编译:
它抱怨LoaderService
在当前上下文中不存在。那么发生了LoaderService
什么?有替代品吗?它是否仍然存在但只是在其他地方?
c# - 在显示到 WPF WebBrowser 控件之前操作 HTML 文档
在 WebBrowser 中显示之前,我必须更改内部 html 代码。
测试页面 - http://aksmod.ru/skajrim-mod-kukri-ot-aksyonov-v5-0/
我尝试使用 AngleSharp.Scripting,但它无法正常工作(广告无法加载)
后来想了想LoadCompleted
,结果还是一样
该事件只是不会触发(尽管它适用于其他一些站点)。
那么,我错过了什么?
更新 1
MCVE
XAML
背后的代码
c# - AngleSharp,在 SubmitAsync 上选择提交输入
我有一个问题与 SubmitAsync 一样,选择输入(类型提交),因为页面上有几个这样的输入,并且脚本按下(执行)第一个输入
提交输入 我想通过函数重载指定输入,但据了解,它只是指向表单中的输入
谢谢!
c# - AngleSharp 文本元素解析
我正在使用AngleSharp开发有限的浏览器功能。它解析 HTML 的方式让我有点困惑。例如,以下“div”的内容被解析为一个 BR 子元素和一个带有文本“test”的 TextContent 属性。所以不可能找到 BR 元素在文本中的位置。
我认为如果 DIV 有 3 个子组件会更好。第一个是内容为“te”的文本元素,然后是 BR 元素,其后是另一个内容为“st”的文本元素。
有没有其他解决方案?
c# - 在表单中提交项目
[编辑于 10/01/18 以提供有关代码的更多背景信息。此版本提供使用的完整代码]
我在使用 AngleSharp 提交表单时有些挣扎。
我使用 AngleSharp 来废弃这个网站以获取代理地址。基本上,我用 AngleSharp 和 IBrowsingContext 打开网站(我的代码中的页面)
然后我 SubmitAsync Forms[0] 以获得完整的代理列表(请参阅网站链接以了解我的意思)并阅读那里的不同代理[这部分未在此处介绍]。
当我想在不同的页面中导航时,它变得更加复杂(通常大约 60 个页面,底部有一个导航栏,即页面中的表格1)。
按照 Florian Rappl 的建议,我根据他给出的示例打开了资源加载(请参见此处)。在下面发布的代码中,我评论了内存使用情况,因为似乎资源加载循环下载了一些内存使用量猛增的东西。为了比较,我提供了没有加载资源的内存使用情况。这是控制台应用程序的完全可行的代码。
.
脚本执行有一半的时间会引发异常。其余的 Page.Active 评估是'((AngleSharp.Dom.Document)((AngleSharp.BrowsingContext)Page).Active).ActiveElement' threw an exception of type 'System.NullReferenceException'