0

我正在 WPF、C# 和 VS2010 中开发一个应用程序,但不知道如何继续...

我对获取 html 文件中引用的所有 .jpg 和 .bmp 图像的算法感兴趣。如何从 html 文件中提取正文?

谢谢

4

2 回答 2

0

你可以用正则表达式来做到这一点。

http://msdn.microsoft.com/en-us/library/ms228595.aspx

以下模式应该有效:

(http?:\/\/.*\.(?:png|jpg|gif))
于 2012-04-13T19:11:29.273 回答
0

HTML Agility Pack是一个非常可靠的库,用于从 HTML 文档中提取元素。一个简单的观点是将其视为 XPATH 的包装器,并带有一个不错的 API。

于 2012-04-13T19:14:38.797 回答