我正在考虑制作一个小网络工具来分析整个网站的搜索引擎优化和网络可访问性。
首先,这只是目前的私人工具。抓取整个网站会占用大量资源和时间。我发现这wget
是下载整个站点的标记的最佳选择。
我计划使用 PHP/MySQL(甚至可能是 CodeIgniter),但我不太确定这是否是正确的方法。总有人推荐 Python、Ruby 或 Perl。我只知道 PHP 和一点 Rails。
我还在SourceForge 上的 PHP 中找到了一个很棒的 HTML DOM 解析器类。
但是,问题是,我需要一些关于我应该做什么和不应该做什么的反馈。从我应该如何进行爬网过程到我应该检查关于 SEO 和 WCAG 的所有内容。
那么,当你听到这句话时,你会想到什么?