0

我有一个联系表格,其中电子邮件实际上可以在源中访问,因为我正在使用 cgi 文件来处理它。我担心的是邮件爬虫,我想知道这是否可行,我应该切换到另一种更安全的形式。或者,如果有一些“迷惑”爬虫的技巧?谢谢你的想法。

4

4 回答 4

7

如果您将电子邮件的目标地址放在 HTML 表单中,那么这不仅是邮件爬虫的问题,而且垃圾邮件发送者会使用您的联系表单向其他人发送垃圾邮件。他们所要做的就是在该字段中提交具有不同地址的相同表单,您的邮件服务器将很乐意将他们的消息发送给第三方。您不想这样做,因为您的服务器将很快被列入发送垃圾邮件的黑名单。

于 2009-10-24T00:46:52.290 回答
3

如果源是指 HTML 源,那绝对是个问题。您可以编辑 cgi 文件以在那里对其进行硬编码吗?

于 2009-10-24T00:41:40.130 回答
1

是的,您应该避免这种情况,以尽量减少垃圾邮件。

一种简单的方法是混淆电子邮件,替换为.-dot-等。@-at-

  • 如果一个人需要地址,他知道他必须执行什么
  • 如果您的 CGI 脚本将此地址作为输入,它必须首先去混淆,恢复所有的混淆。
于 2009-10-24T00:45:42.787 回答
1

我总是将电子邮件地址的字符(包括 mailto 语句,如果适用)转换为字符实体。这似乎工作得很好,我还没有收到某些电子邮件地址上的自动垃圾邮件,这些电子邮件地址在不同的网站上以这种方式可用。这个转换器说明了我的意思。

于 2009-10-29T11:20:12.350 回答