问题标签 [spam-prevention]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 垃圾邮件机器人正在弄乱我的日志文件 [Django]
我有一个漂亮可爱的 Django 站点正在运行,但我注意到我的error.log
文件在运行几个月后变得很大,超过 150 MB。结果是一堆垃圾邮件机器人正在寻找众所周知的 URL 漏洞(或其他东西)并攻击一堆子目录,如http://mysite.com/ie
orhttp://mysite.com/~admin.php
等。
由于 Django 使用 URL 重写,它正在寻找适合这些请求的模板,这会引发TemplateDoesNotExist
异常,然后是 500 消息(Django 这样做,而不是我)。我关闭了调试,所以他们只收到通用的 500 消息,但它很快就填满了我的日志。
有没有办法关闭这种行为?或者也许只是阻止IP这样做?
php - 垃圾邮件检测服务的最佳语言选择
我有大约 20 个左右活跃的博客,它们会收到相当多的垃圾邮件。因为我讨厌 CAPCHA,所以另一种选择是非常智能的垃圾邮件过滤。我想构建一个简单的 REST api,比如垃圾邮件检查服务,我会在我的所有博客中使用它。通过这种方式,我可以整合 IP 块并将垃圾邮件检测卸载到Akisment、Mollom、Defensio等 3rd 方,并在未来的某个时候编写我自己的垃圾邮件检测,以便真正深入了解一些非常有趣的垃圾邮件检测算法。
我选择的语言是 PHP,我认为自己非常精通,我真的可以深入挖掘并提出解决方案。我觉得这个项目可以作为学习另一种语言的一个很好的练习。想到的最大的 2 是 Python 和 Ruby on Rails,因为每个人都在谈论它们,就像我们救世主的下一个到来一样。由于这主要是一个 API 并且没有任何管理员或公众面向任何东西,看起来运行一个简单的 http 服务器的基本 Python 似乎是要走的路。我错过了什么吗?伟大的社区,你会推荐什么?我很想听听您的语言、书籍和最佳实践建议。
这必须扩展,我想在写它时考虑到这一点。现在我可能可以使用 3rd 方的免费计划,但很快我就必须扩展整个事情以真正独立思考。现在我想我会把所有东西都存储在一个 MySQL 数据库中,直到我可以对它进行一些真正的分析。谢谢!
php - 如何在 PHP 中找到两个字符串之间的最大公共子字符串?
是否有一种快速算法可以在两个中找到最大公共子串,strings
还是 NPComplete 问题?
在 PHP 中,我可以大海捞针:
我想我可以在其中一个上循环执行此操作,strings
但这将非常昂贵!特别是因为我的应用是搜索电子邮件数据库并查找垃圾邮件(即同一个人发送的类似电子邮件)。
有没有人可以扔掉任何 PHP 代码?
naivebayes - 朴素贝叶斯垃圾邮件过滤效果
朴素贝叶斯过滤过滤垃圾邮件的效果如何?
我听说垃圾邮件发送者很容易通过填充额外的非垃圾邮件相关词来绕过它们。贝叶斯过滤器可以使用哪些编程技术来防止这种情况发生?
php - 如何使用 PHP 对电子邮件地址进行模糊处理,以免垃圾邮件发送者轻松获取它们?
我正在使用 PHP 编程,并希望创建具有电子邮件地址的网页,这些电子邮件地址很容易被人类阅读,但不容易被垃圾邮件发送者收集。电子邮件地址来自用户输入,我想我可以使用正则表达式来识别地址,但我不清楚我应该如何替换电子邮件地址或用什么替换,以防止大多数自动垃圾邮件机器人收获它们。
这是一个想法:(伪代码)
希望机器人会在 span 标签上绊倒。
最后,我正在寻找一种不会干扰mailto:
标签内的电子邮件地址的解决方案。
如何 防止阻止机器人收集电子邮件地址?哪些方法可以保护网站上的电子邮件免受垃圾邮件机器人的侵害?也许还有一些其他人......
spam-prevention - 在网页上进行基本视图跟踪的最佳方法是什么?
我有一个面向网络、可匿名访问的博客目录和博客,我想跟踪每篇博客文章收到的浏览量。
我想让这个尽可能简单,准确度只需要一个近似值。这不适用于分析(我们有谷歌),我不想做任何日志分析来提取统计数据,因为在这种环境中运行后台任务很棘手,我希望数字尽可能新鲜。
我目前的解决方案如下:
- 一个 Web 控件,它只是在表中为每个 GET 记录一个视图。
- 使用正则表达式和 UserAgent 字符串排除已知网络爬虫列表
- 规定排除某些 IP 地址(已知的垃圾邮件发送者)
- 提供锁定一些帖子(当垃圾邮件发送者来找它时)
这实际上似乎做得很好,但有几件事让我烦恼。垃圾邮件发送者仍然点击一些帖子,从而扭曲了观点。我仍然必须手动监控视图以更新我的“坏”IP 地址列表。
有人对我有更好的建议吗?有人知道如何跟踪 StackOverflow 问题的观点吗?
usability - recaptcha.net 是否有任何替代品来阻止垃圾邮件?
我公司的一位比我排名更高的成员拒绝在他的网站上使用 recaptcha.net 来阻止来自公共表单的垃圾邮件。他认为任何来到我们网站的人都很难输入他们的信息,因为图灵测试“非常难以阅读”。
有没有使用这种方法的替代方法? 那不包含这些难以阅读的图像?
(好吧,愚蠢的问题......如果由我决定,我们会使用recaptcha,因为地球上的其他人都这样做......但我只是想我还是会检查一下。)
此外,使用由 Javascript 设置并随后在服务器上检查的隐藏字段真的是阻止垃圾邮件的好方法吗?
我自己并不真正相信它......因为有各种各样的 Javascript 引擎不能在浏览器中运行但可以运行 Javascript(Rhino 等......),这很容易被用来阻止 JS /服务器端反垃圾邮件方法。
java - 什么是最好的开源 Java 贝叶斯垃圾邮件过滤器库?
在 Stackoverflow 的其他答案中,有人建议 Weka 很好,但还有其他答案(Classifier4j、jBNC、Naiban)。
有人对这些有实际经验吗?
php - 如何保护我的论坛免受垃圾邮件的侵害?
我在我掌握的网站上有一个论坛,每天都会收到垃圾邮件。目前我删除垃圾邮件并阻止IP。但这不是很好。被阻止的 IP 列表正在迅速增长,但论坛中的垃圾邮件数量也在迅速增长。
论坛完全是我自己的代码。它是用 PHP 和 MySQL 构建的。
阻止垃圾邮件的具体方法有哪些?
编辑 我忘了提到的是,论坛需要对未注册用户开放才能发帖。有点像博客评论。
email - 从我的网络应用程序发送电子邮件的最佳方式,使其看起来像是来自我的用户帐户
我正在开发一个 Web 应用程序。用户将创建将发送给另一个人的电子邮件。
我希望从我的系统上的用户名和用户的电子邮件地址中显示发送的电子邮件。如果他们回复电子邮件,那么它应该直接发送到发件人的电子邮件地址。
但是,我担心电子邮件看起来像垃圾邮件到电子邮件过滤器。
有没有合适的方法来做到这一点?
我注意到在 WordPress 博客的“联系”页面上做了一些非常相似的事情。电子邮件标题如下所示:
有趣的是,“from”标签中的显示名称和显示在主题行中的名称是经过编码的。我不知道这是否有助于垃圾邮件过滤器,但认为至少值得一提。
此外,在此示例中谁会收到无法送达的通知?它会发送到 sender@senderdomain.com 还是发送到 donotreply@wordpress.com?