问题标签 [profanity]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
9 回答
100339 浏览

list - “坏话”过滤器

不是很技术,但是...我必须在我们正在开发的新站点中实现一个坏词过滤器。所以我需要一个“好”的坏词列表来为我的数据库提供......任何提示/方向?用谷歌环顾四周,我找到了这个,这是一个开始,但仅此而已。

是的,我知道这种过滤器很容易逃过......但客户意志就是客户意志!:-)

该网站必须过滤掉英语和意大利语单词,但对于意大利语,我可以请我的同事帮助我创建一个社区构建的“parolacce”列表:-) - 一封电子邮件就可以了。

谢谢你的帮助。

0 投票
4 回答
3406 浏览

php - 正则表达式 - 匹配(仅)具有混合字符的单词

我正在编写我的反垃圾邮件/恶意过滤器,如果可能的话,我需要,

仅匹配(检测)由混合字符组成的单词,例如:fr1&nd$ 而不是朋友

这可能与正则表达式!?

最好的祝福!

0 投票
4 回答
2530 浏览

iphone - Objective C for iPhone 中的基本脏话过滤器

志同道合的人如何应对过滤亵渎的基本挑战,显然不可能解决所有情况,但最好有一个最基本的级别作为第一道防线。

在 Obj-c 我有

然后我遍历每个标记以查看是否在每个标记中找到任何关键字(我在列表中有大约 400 个)。

实现误报也是一个问题,如果单词是完美匹配,则将其标记为亵渎,否则如果发现超过 3 个带有亵渎的单词但未完全匹配,则它也被标记为亵渎。

稍后我将使用一个更精确地解决问题的网络服务,但我真的只需要一些基本的东西。所以如果你写了阴茎这个词,它会变得顽皮顽皮,写得不好。

0 投票
3 回答
9848 浏览

c# - 在 C# 中解析“坏”字的字符串的最佳方法是什么?

我在想类似的东西:

但我确信有更好的方法。

提前致谢!

更新 我不希望自动删除淫秽内容......对于我的网络应用程序,如果使用了我认为“坏”的词,我希望得到通知。然后我会自己审查它以确保它是合法的。各种自动标记系统。

0 投票
6 回答
24895 浏览

python - 什么是好的 Python 亵渎过滤器库?

就像https://stackoverflow.com/questions/1521646/best-profanity-filter一样,但是对于 Python,我正在寻找可以在本地运行和控制自己的库,而不是 Web 服务。

(虽然很高兴听到您对脏话过滤的原则性基本反对意见,但我并不是在这里专门寻找它们。我知道脏话过滤无法识别出所有伤害性的话。我知道发誓,在宏伟的计划中的东西,不是一个特别大的问题。我知道你需要一些人工输入来处理内容问题。我只想找到一个好的库,看看我能用它做什么。)

0 投票
1 回答
1359 浏览

blacklist - 西班牙语亵渎黑名单

我的任务是为 Rails 应用程序实现基于黑名单的亵渎过滤器。我知道基于黑名单的过滤存在很多问题,但这个决定是在我头上做出的。挑战:我正在寻找一个很好的西班牙脏话列表以进入过滤器。对于英语,我们正在建立一个列表,该列表详尽地列出了共轭/复数/等,每行一个文本文件。西班牙语的公共领域中是否存在这样的列表?

0 投票
2 回答
99 浏览

profanity - 如何处理社区中被标记的内容?

在几乎只有用户生成内容的多语言社区中,是否有一种常用的方法来处理标记的内容(亵渎、种族主义、一般非法内容等)?

由于会有很多非英语内容,处理标记本身的唯一方法是由社区本身进行众包,并以某种方式自动隐藏/删除标记的内容。但是什么方法可以用来阻止滥用呢?例如“我不喜欢他,让大家举报并删除”

0 投票
2 回答
1565 浏览

profanity - 如何过滤掉 base36 ID 中的脏话?

我想在我正在开发的 Web 应用程序中使用 base36 ......但是由于用户可以看到 id 作为 url,我想过滤掉亵渎。有没有人解决这个问题?或者这甚至是一个真正的问题?

跳过我的数据库序列中的数字是否有意义?

0 投票
1 回答
126 浏览

numeric - 如何过滤掉数字 ID 中的脏话?

我想在我正在开发的 Web 应用程序中使用数字 ID...但是,由于 ID 作为 URL 对用户可见,因此我想过滤掉亵渎。像(我会让你弄清楚它们是什么):

有没有人解决这个问题?这甚至是一个真正的问题吗?

跳过我的数据库序列中的数字是否有意义?

另请参阅:如何过滤掉 base36 ID 中的脏话?.

0 投票
3 回答
467 浏览

php - 检查值是否在数组中

这可能很容易,但我的 php 很生锈。我需要实现一个坏词过滤器......我目前有这个:

......还有一个包含脏话的脏话数组。问题是我希望能够检查用户输入的名称的任何部分是否包含这些坏词之一....我目前只检查名称是否是确切的坏词....如何我这样做吗?

谢谢