问题标签 [word-boundary]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
12739 浏览

regex - 如何使用 grep/egrep 在文件中查找重复的单词?

我需要在 unix(bash)中使用 egrep(或 grep -e)在文件中查找重复的单词

我试过了:

但由于某种原因,这些认为事情不是重复的!例如,它认为字符串“word words”符合条件,尽管存在单词边界条件\> or \b

0 投票
1 回答
511 浏览

regex - 为什么 vim 的正则表达式语法有两个单词边界?

Javascript 的正则表达式语法只有一个单词边界:\b.

Vim 的正则表达式语法有两种:(\<单词开头)和\>(单词结尾)。

谁能给我一个搜索示例,该搜索可以通过 vim 样式的单词边界实现,但无法通过 javascript 样式实现?

还是具有单个单词边界的正则表达式语法可以做同样的事情,但具有开始和结束边界还有其他一些优势?

0 投票
2 回答
242 浏览

php - 为什么 \b 对于某些语言不能正常工作?

这是我的代码:(它适用于英语)


但我不知道为什么,上面的REGEX对波斯语不起作用:(它总是返回1

我该如何解决?

0 投票
0 回答
52 浏览

java - 可以让 BreakIterator 将“'tis”识别为一个单词吗

使用 a BreakIterator.getWordInstance(),文本"can't"被认为是一个“单词”

一个小实验表明,虽然单词中的撇号认为是单词的一部分。两端的撇号被认为与单词分开 - 即在撇号和字母之间报告单词边界。

即使拼写正确,这也排除了诸如"'tis"和之类的单词被视为“单词”。"dogs'"

有没有办法纠正这种行为,或者这是一个错误?

0 投票
2 回答
449 浏览

javascript - JavaScript reg ex 撇号是新词边界

我试图定位字符串中每个单词的第一个字母。我正在使用 JavaScript。我发现有关 Python 和 PHP 的讨论并没有解决我特定于 JavaScript 的问题。

我有一个函数将 regEx 找到的每个字母大写。我的结果是m撇号大写之后。我该如何避免这种情况?

大写函数后:I'M A Little Tea Pot"

0 投票
2 回答
278 浏览

php - 某些数字或带有单词边界的字符后的省略号

0 投票
1 回答
94 浏览

regex - Regex - Issues with using Boundary to excluding words

In my authentification web site, I'm using regex to control a blacklist password. (example of blacklisted password : 12345678, 123456789, baseball, football)

I would like to add new regex rule (using boundary), which will exclude words (black listed password). I have read some similar questions on StackOverflow and tried to declare it with something like this:

this regex doesn't match the words above, it's correct. For exemple "Baseball" with a letter, number or special character (before or after the "baseball") must match.

But "baseball!" doesn't match contrary to "!baseball". Can you give me some advices how to do it?

0 投票
1 回答
1227 浏览

regex - 单词边界末端和边缘之间的正则表达式差异

正则表达式的 R 帮助文件说

符号 \< 和 \> 分别匹配单词开头和结尾的空字符串。符号 \b 匹配单词边缘的空字符串

结尾和边缘(单词)有什么区别?

0 投票
3 回答
985 浏览

php - PHP 数组 str_replace 整个单词

我做str_replace的很长string,我$search是一个array

$search我在两者上添加空格的原因$replace是因为我只想匹配整个单词。正如您从我上面的代码中猜到的那样,如果我删除了空格并且我的真正长字符串是:

然后我会得到类似的东西

这是错误的,因为我想要以下结果:

那么有什么问题呢?

没什么,它确实有效。但我不喜欢它。看起来很脏,编码不好,效率低下。

我意识到我可以使用修饰符使用正则表达式来做这样的事情,\b但我不擅长正则表达式,所以我不知道该怎么做preg_replace

0 投票
0 回答
57 浏览

javascript - 正则表达式单词边界不适用于变音符号

假设您有以下输入要检查:

和以下 JavaScript 正则表达式:

我期望的是,当我搜索匹配时,什么都不会找到,无论是“ipsu”还是“ipsü”,但有一个单词边界。但是“ipsü”这个词会被匹配,即使末尾有字符“m”而不是一个词的边界。我不明白原因。

有谁知道原因?

看这个例子:

https://regex101.com/r/km0zW7/2