问题标签 [anglesharp]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
588 浏览

anglesharp - 在 AngleSharp 中,如何遍历所有列表项(包括嵌套项)并将每个列表项转换为具有父属性的单个列表

在 AngleSharp 中,我如何遍历所有列表项(包括嵌套项)并将每个列表项转换为具有父属性的单个列表。我尝试了下面的代码

这给了我一个空列表,列表已创建,但项目上下文尚未被复制。示例列表

0 投票
1 回答
665 浏览

c# - 如何构建自定义 AngleSharp 元素并将 HTML 部分插入/转换到元素中

我正在使用 AngleSharp,并且想知道如何将 HTML 部分转换为 SVG、XML 或其他自定义括号支持格式。

问题:如何构建自定义 AngleSharp IElement,然后转换自定义元素内的 div(或链接)内容,即获取我找到的 div/链接,然后将 div 内容放入自定义元素中


下面是我正在尝试的代码

谢谢

0 投票
1 回答
1094 浏览

c# - 如何使用anglesharp从pagesource获取所有img标签

我确实使用 webview 来获取完整页面源并将其写入文件

所以现在我需要从文件中提取所有图像

我使用 StreamReader 读取文件并将其提供给名为 TheHtmlSource 的字符串,如您在代码中看到的那样

这是我的代码

但我不工作我不断收到 NullReference 错误

我在 Visual Studio 中使用 Xamarin

任何帮助将不胜感激

0 投票
1 回答
996 浏览

c# - 如何在 AngleSharp 中解析匿名块中的文本?

我正在使用 AngleSharp 解析网站内容,但我遇到了匿名块的问题。

查看示例代码:

因此,productTitle 包含来自 div.comments-likes 的数字,输出为:

你好,世界1

又一个 helloworld 25

我尝试过类似product.FirstElementChild.NextElementSibling.Text();但链接元素的下一个兄弟是 div.comments-likes,而不是匿名块。表明:

1

25

因此,会跳过匿名块。:(

我发现的最佳解决方法是删除所有阻止块,例如:

从匿名块中解析文本的更好方法是什么?

0 投票
1 回答
440 浏览

c# - C# AngleSharp 解析流有什么问题?

问题是,文档中只写入了一部分而不是所需数量的标题。控制台输出正常。

这里代码:

不知道是什么问题。文件中写入了不同数量的标题,而后者不完全。可能线程被阻塞或程序简单地关闭..我不明白它是如何依赖的

0 投票
1 回答
447 浏览

c# - 如何为 DOM 指定一个输入文件使用角度锐利?

使用 AngleSharp,我如何指定要填写的文件<input type="file" name="myInputFile">?我读过这个 StackOverflow question,但它似乎与我预期的情况不同。我正在尝试在上传我选择的文件时以编程方式填写表格。

0 投票
1 回答
368 浏览

vb.net - Anglesharp context.openAsync() 返回无法识别的字符。我能做些什么?

我正在使用 AngleSharp 来“打开”一个 URL,更改valuean 的属性,input然后提交form.

但是当我从 URL 获取 HTML 代码时,我在我感兴趣的name属性中得到了一个无法识别的字符。input看:

正如您所看到的,这是表单中唯一的,因此我可以通过它的其他属性作为选择器input“捕捉”它(以更改)。value像这样:[type=password]

所以,问题是当我提交表单时,它发送的帖子数据名称错误,它们无法被识别。我通过在浏览器中打开此 URL 了解了无法识别的字符是什么,并使用 Wireshark 仔细检查它(以获取字符的 HEX 值)。

最后,charA在浏览器源代码视图中是希腊语,正如 Wireshark 所说,C1它是Á带有描述的符号:(Latin capital letter A with acute请参阅http://www.ascii-code.com/

我认识创建这个网络界面的人,他告诉我他使用了一个希腊语A是错误的,他无法更改它(我将解释原因)。

所以,既然我知道服务器期望什么,我想我也可以设置name属性然后发送表单。但是,当我这样做时,由于我在 Wireshark 中签入时,它并没有得到认可,因此该字符与您提交表单时浏览器发送的字符不同。(我努力设置正确的名称,但没有运气)。

我还认为这可能是某种编码问题,但我没有设法在context配置中设置编码。在获得 HTML 之前,我将文化设置为“el-GR”,但没有任何改变。

我能做些什么?你有什么建议吗?

PS。这是一个由微控制器托管的低安全性 Web 界面。无法更改 HTML,因为设备已获得认证。此外,该界面在浏览器中使用时可以完美运行。

0 投票
2 回答
364 浏览

c# - 进行异步调用时出现 AngleSharp 错误

我正在尝试使用AngleSharp加载许多页面。这个想法是它加载一个页面,如果这个页面有到下一个的链接,加载下一个页面等等,这些方法描述如下。但我得到了内部异常:

我相信与同步有关的东西Thread

0 投票
1 回答
2377 浏览

c# - AngleSharp 提取格式化文本

我想知道是否可以使用 AngleSharp 从 HTMLDocument 中提取格式化文本。我正在使用以下代码来提取文本。我遇到的问题是提取的文本一起运行,每个元素之间没有中断。

这将返回以下文本

一些示例来源这是一个段落元素

理想情况下,我希望它返回 一些示例源 这是一个段落元素 ,其中每个节点文本值之间存在一些分隔。

0 投票
1 回答
872 浏览

c# - 如何使用 AngleSharp 从 html 字符串中获取所有评论标签?

如何使用 AngleSharp 从 HTML 字符串中查找所有注释标签。注释可以是单行的,也可以是多行的。