我正在 WPF、C# 和 VS2010 中开发一个应用程序,但不知道如何继续...
我对获取 html 文件中引用的所有 .jpg 和 .bmp 图像的算法感兴趣。如何从 html 文件中提取正文?
谢谢
我正在 WPF、C# 和 VS2010 中开发一个应用程序,但不知道如何继续...
我对获取 html 文件中引用的所有 .jpg 和 .bmp 图像的算法感兴趣。如何从 html 文件中提取正文?
谢谢
你可以用正则表达式来做到这一点。
http://msdn.microsoft.com/en-us/library/ms228595.aspx
以下模式应该有效:
(http?:\/\/.*\.(?:png|jpg|gif))
HTML Agility Pack是一个非常可靠的库,用于从 HTML 文档中提取元素。一个简单的观点是将其视为 XPATH 的包装器,并带有一个不错的 API。