此代码搜索网站 html 文件并提取域名列表...
httrack --skeleton http://www.ilovefreestuff.com -V "cat \$0" | grep -iEo '[[:alnum:]-]+\.(com|net|org)'
结果看起来像这样。
- domain1.com
- domain2.com
- domain3.com
我计划在非常大的网站上使用此代码,因此这将生成非常大的域名列表。另外,上面的代码会产生很多重复的域名。因此,我设置了一个具有唯一字段的 mysql 数据库,因此不会插入重复项。
使用我有限的编程知识,我将下面的这一行代码拼凑在一起,但这不起作用。当我执行命令时,我没有收到任何错误,只有一个新的命令提示符 > 和一个闪烁的光标。我假设我没有使用正确的语法或方法,和/或我想做的事情可能无法通过命令行。任何帮助深表感谢。
httrack --skeleton http://www.ilovefreestuff.com -V "cat \$0" | domain=“$(grep -iEo '[[:alnum:]-]+\.(com|net|org)’)” | mysql -pPASSWORD -e "INSERT INTO domains.domains (domains) VALUES ($domain)”
是的,我的数据库名称是域,我的表名称是域,我的字段名称是域。