问题标签 [word-boundary]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
regex - 如何使用 grep/egrep 在文件中查找重复的单词?
我需要在 unix(bash)中使用 egrep(或 grep -e)在文件中查找重复的单词
我试过了:
和
但由于某种原因,这些认为事情不是重复的!例如,它认为字符串“word words”符合条件,尽管存在单词边界条件\>
or \b
。
regex - 为什么 vim 的正则表达式语法有两个单词边界?
Javascript 的正则表达式语法只有一个单词边界:\b
.
Vim 的正则表达式语法有两种:(\<
单词开头)和\>
(单词结尾)。
谁能给我一个搜索示例,该搜索可以通过 vim 样式的单词边界实现,但无法通过 javascript 样式实现?
还是具有单个单词边界的正则表达式语法可以做同样的事情,但具有开始和结束边界还有其他一些优势?
php - 为什么 \b 对于某些语言不能正常工作?
这是我的代码:(它适用于英语)
但我不知道为什么,上面的REGEX对波斯语不起作用:(它总是返回1
)
我该如何解决?
java - 可以让 BreakIterator 将“'tis”识别为一个单词吗
使用 a BreakIterator.getWordInstance()
,文本"can't"
被认为是一个“单词”
一个小实验表明,虽然单词中的撇号被认为是单词的一部分。两端的撇号被认为与单词分开 - 即在撇号和字母之间报告单词边界。
即使拼写正确,这也排除了诸如"'tis"
和之类的单词被视为“单词”。"dogs'"
有没有办法纠正这种行为,或者这是一个错误?
javascript - JavaScript reg ex 撇号是新词边界
我试图定位字符串中每个单词的第一个字母。我正在使用 JavaScript。我发现有关 Python 和 PHP 的讨论并没有解决我特定于 JavaScript 的问题。
我有一个函数将 regEx 找到的每个字母大写。我的结果是m
撇号大写之后。我该如何避免这种情况?
大写函数后:I'M A Little Tea Pot"
regex - Regex - Issues with using Boundary to excluding words
In my authentification web site, I'm using regex to control a blacklist password. (example of blacklisted password : 12345678, 123456789, baseball, football)
I would like to add new regex rule (using boundary), which will exclude words (black listed password). I have read some similar questions on StackOverflow and tried to declare it with something like this:
this regex doesn't match the words above, it's correct. For exemple "Baseball" with a letter, number or special character (before or after the "baseball") must match.
But "baseball!" doesn't match contrary to "!baseball". Can you give me some advices how to do it?
php - PHP 数组 str_replace 整个单词
我做str_replace
的很长string
,我$search
是一个array
。
$search
我在两者上添加空格的原因$replace
是因为我只想匹配整个单词。正如您从我上面的代码中猜到的那样,如果我删除了空格并且我的真正长字符串是:
然后我会得到类似的东西
这是错误的,因为我想要以下结果:
那么有什么问题呢?
没什么,它确实有效。但我不喜欢它。看起来很脏,编码不好,效率低下。
我意识到我可以使用修饰符使用正则表达式来做这样的事情,\b
但我不擅长正则表达式,所以我不知道该怎么做preg_replace
。
javascript - 正则表达式单词边界不适用于变音符号
假设您有以下输入要检查:
和以下 JavaScript 正则表达式:
我期望的是,当我搜索匹配时,什么都不会找到,无论是“ipsu”还是“ipsü”,但有一个单词边界。但是“ipsü”这个词会被匹配,即使末尾有字符“m”而不是一个词的边界。我不明白原因。
有谁知道原因?
看这个例子: