问题标签 [profanity]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
javascript - 用于替换字符串中的亵渎词的正则表达式
我正在尝试替换文本字符串中的一组单词。现在我有一个循环,它表现不佳:
我想要一些工作得更快的东西,以及用与###!
原始单词长度相同的标记替换坏单词的东西。
php - 用于阻止不良内容的设计模式
去年,我正在开展一个圣诞节项目,该项目允许客户相互发送电子邮件,其中包含 256 个字符的自由文本字段,用于他们的圣诞节请求。该项目通过在(非常大的)产品数据库中搜索与文本字段匹配的建议产品来工作,但为那些无法找到相关产品的客户提供免费文本选项。
一个明显的担忧是客户有机会向一些毫无戒心的客户发送相当明确的请求,而公司的品牌就围绕在它周围。
由于各种原因,该项目最终没有进行,其中之一是亵渎。
然而,我回过头来思考这个项目,想知道这里可以使用哪些类型的验证。我知道clbuttic我知道这是对这种性质的任何问题的标准回答。
我考虑的解决方案是:
- 通过 WebPurify 之类的东西运行它
- 使用 MechanicalTurk
- 编写一个在列表中查找单词的正则表达式模式。一个更复杂的版本也会考虑这个词的复数和过去时。
- 写出一系列可疑的单词,并为每个单词打分。如果提交超过分数,则验证失败。
所以有两个问题:
- 如果提交失败,从UI角度如何处理?
- 这些解决方案或您可以建议的任何其他解决方案的优缺点是什么?
注意 - 像“亵渎过滤器是邪恶的”这样的答案是无关紧要的。在这种半假设的情况下,我还没有决定实施脏话过滤器,也没有决定是否实施。我只需要用我的编程技能做到最好(如果可能的话,应该在 LAMP 堆栈上)。
language-agnostic - 如何防止用户输入脏话?
可能重复:
您如何实施良好的亵渎过滤器?
我必须从用户那里获取城市名称作为输入,但我不想接受任何亵渎。谁能告诉我如何阻止用户输入这样的词?
php - 未检测到正则表达式 preg_quote 符号
我在数据库中有一本脏话词典,下面的效果很好
$t
是输入文本,简单地说,$f = preg_quote("punk")
; "punk"
是来自数据库字典,所以此时循环中的表达式如下
preg_quote
替换符号,例如。#
with\\#
以便表达式被转义,但是当字典正在检查时。"F@CK"
或者"A$$"
在使用上述表达式的输入字符串中未检测到这些符号,我在字典中都有a$$
,f@ck
但它们不起作用。如果我删除preg_quote()
这个词,正则表达式是无效的,因为这些符号没有被转义。
关于如何检测的任何建议"a$$"
???
编辑:
所以我猜想没有按预期工作的表达式是例如。
哪个应该找到f @ck$t
更新:
这是我的用法,简单地说;如果在$m
用 替换它们中有匹配项"\*\*\*\*"
,则整个块在字典中每个单词的循环内,$f
是字典单词并且$t
是输入
更新:看哪,var_dump
:
更新:仅当单词以符号结尾时才会发生这种情况。我测试过,没问题"a$$hole"
,但"a$$"
不起作用。
另一个更新:试试这个简化版本,$words
作为临时字典
我应该期待看到"Input whatever you feel like here eg. \*\*\*"
结果。
php - 字符串已使用标点符号作为分隔符进行拆分;如何重新组装并放回标点符号?
我使用 Trie 数据结构实现了一个亵渎过滤器。每个脏话都被添加到 Trie 中。当我有一个字符串可以删除脏话时,我会使用标点符号来分解字符串,并使用 Trie 检查每个单词。如果发现我用星号替换。然后我内爆字符串问题是,我如何跟踪标点符号?换句话说,我如何确保生成的字符串有标点符号?
c# - 任何用于网站的开源/免费 .NET 亵渎过滤器?
您是否知道任何开源/免费的 .NET 亵渎过滤器(准确地说是 ASP.NET MVC)?我搜索了谷歌,但我找不到任何东西。如果可能的话,我想避免完全自己实现它。很容易犯错或忽略某些东西。
asp.net-mvc-2 - 如何过滤 ASP.NET MVC 中文本框的坏词?
我有一个要求,我想过滤文本框值,即应该删除用户输入的坏词。一旦用户输入坏词并单击提交按钮,就会调用操作。在模型中的某个地方(任何地方)我应该能够删除坏词并将过滤后的值重新绑定回模型。
我怎样才能做到这一点?
regex - 使用正则表达式的脏话过滤器(100 个单词的列表)
从给定的字符串中删除亵渎词的正确方法是什么:
1)我有一个包含 100 个单词的列表,要在字符串数组中查找。2)处理部分单词的正确方法是什么?大多数人是如何处理这个问题的?例如单词mass。然后有时部分词也不好 - 假设 foobar 是一个非常亵渎的词,我可能想要禁止 foobar 和 foobar* 和 *foobar。
那么,您是将所有单词放在一个表达式中还是在列表中循环?
解决它的正确方法是什么?我正在使用 Groovy/Grails,但欢迎任何现代语言示例。
php - word profanity match in php
Possible Duplicate:
How do you implement a good profanity filter?
i need to build a script that remove bad words from someone post or username or anythong else they submit to my site.
i have a small script that already remove them but it also cut good words like: a**
, f**k
, etc...
now my problem is i have a script that already remove bad words (from my list) but it also remove good one
i do:
i want to make sure i wont strip good words or first name for example, what is the best solution?
thanks
php - 使用包含大量坏词的 PHP 和 MySQL 表有效地检测短信中的亵渎
我有一个 mysql 表,其中包含一个多语言坏词的大列表(大约 5000 个单词)。我需要找到一种有效的方法来过滤掉用户创建的短信中的亵渎词。在我看来,使用 php regex 并不合适,因为坏词列表很大。
此外,将消息分成单词然后查询每个单词是一种解决方案,这对于用户发布大量消息的高流量站点来说是可怕的。我需要一个优化的解决方案,因为许多用户将同时使用此服务。
有什么建议么?或者如果你认为正则表达式是合适的,那么你能解释一下cpu/内存使用和执行时间方面的可行性吗?