我最近使用 Java 和 JSoup (http://jsoup.org/) HTML 解析器编写了一个自定义网络爬虫/蜘蛛。网络爬虫非常初级——它使用 Jsoup 的connect和get方法来获取页面的来源,然后使用其他 JSoup 方法来解析内容。它会随机跟踪它找到的几乎所有链接,但它不会尝试下载文件或执行脚本。
爬虫从一长串基本上随机的网页中挑选种子页面,其中一些可能包含成人内容和/或恶意代码。最近,当我运行爬虫时,我的防病毒软件 (Avast) 将其中一个请求标记为“检测到威胁”。有问题的 URL 看起来是恶意的。
我的问题是,我的计算机会通过我的网络爬虫感染病毒或任何类型的恶意软件吗?我应该采取任何预防措施或检查吗?