我希望在 C# 窗口窗体中开发一个 Web 刮板。我要完成的工作如下:
- 从用户那里获取 URL。
- 在 WINForms 的 IE UI 控件(嵌入式浏览器)中加载网页。
- 允许用户选择文本(连续、小(不超过 50 个字符))。从加载的网页。
- 当用户希望保存位置(HTML DOM 位置)时,必须将其保存到数据库中,以便用户可以在后续访问期间使用该位置来获取该位置的数据。
假设加载的网站是一个价格列表网站,并且报价不断变化,想法是保持 DOM 层次结构,以便我下次可以遍历它。
如果所有 HTML 元素都有其 id 属性,我将能够做到这一点。在 id 为 null 的情况下,我无法做到这一点。
有人可以对此提出一个有效的想法(如果可能的话,一个最少的代码片段)。?
即使您可以共享一些在线资源,这也会有所帮助。
谢谢,
维杰