问题标签 [word-boundary]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
7 回答
82527 浏览

regex - 如何用正则表达式匹配表达式后的第一个单词?

例如,在此文本中:

Lorem ipsum dolor sit amet, consectetur adipiscing elit。Nunc eu Tellus vel nunc pretium lacinia。Proin sed lorem。疯狂的 ipsum。Nunc a libero quis risus sollicitudin imperdiet。

我想匹配“ipsum”之后的单词。

0 投票
4 回答
4852 浏览

c# - 查找严格以 $ 开头的单词,Regex C#

我需要找到严格以“$”开头且仅包含数字的单词的所有匹配项。所以我写了

这给了我 4 场比赛

所以我想到了使用 \b 来使用单词边界:

但它再次匹配

给我20美元。

我试过

但我失败了。

我正在寻找说,仅当单词以 $ 开头并且后跟 DIGITS 时才接受。我如何告诉它以 $ 开头,因为我认为 \b 使它假定单词边界,这意味着包围在字母数字字符内。

解决办法是什么?

0 投票
3 回答
2730 浏览

regex - AS3 RegExp 匹配带有边界类型字符的单词

我想匹配一个单词列表,当这些单词是真正的单词时,这很容易。例如/\b (pop|push) \b/gsx,当针对字符串运行时

pop推了门,但它又弹回来了

将匹配单词 pop 和 push 但不弹出。

对于包含通常符合单词边界的字符的单词,我需要类似的功能。所以我需要/\b (reverse!|push) \b/gsx在对着绳子跑的时候

反向推!反向!推

只匹配反向!并推动但不匹配反向!推动。显然这个正则表达式不会那样做,那么我需要使用什么来代替 \b 来使我的正则表达式足够聪明来处理这些时髦的要求?

0 投票
13 回答
203040 浏览

regex - 什么是正则表达式中的单词边界?

我正在尝试使用正则表达式来匹配以空格分隔的数字。我找不到\b(“单词边界”)的精确定义。我曾假设这-12将是一个“整数词”(由 匹配 \b\-?\d+\b),但似乎这不起作用。我会很感激知道的方式。

[我在 Java 1.6 中使用 Java 正则表达式]

例子:

这将返回:

0 投票
2 回答
241 浏览

regex - \b 的正则表达式

我正在用 Java 为 unicode 文本编写正则表达式。但是,对于我正在使用的特定脚本 - 梵文 (0900 - 097F),单词边界存在问题。\b 匹配依赖元音的字符(如 093E-094C),因为它们被视为空格字符。

示例:假设我有字符串:“कमल कमाल कम्हल कम्हाल” 请注意,第二个单词中的“मा”是由 म 和 ा(识别为空格字符)组合而成。最后一句话也是如此。这导致 \b 将 'कमाल' 中的 'ल' 与正则表达式 \b\w\b 匹配,根据语言,这不正确。

我希望这个例子有帮助。

我可以编写一个行为类似于 \b 的正则表达式,但它与某些字符不匹配吗?任何反馈将不胜感激。

0 投票
1 回答
1342 浏览

regex - 带有 unicode 变音符号的正则表达式分词

我正在开发一个基于用户输入使用正则表达式搜索文本的应用程序。用户的一种选择是使用星号包含“匹配 0 个或更多字符”通配符。我需要这个只在单词边界之间匹配。我的第一次尝试是将所有星号转换为(?:(?=\B).)*,这在大多数情况下都可以正常工作。它失败的地方显然是.Net认为带有变音符号的unicode字符和另一个字符之间的位置是断词。我认为这是一个错误,并已将其提交给Microsoft 反馈站点

然而,与此同时,我需要实现功能并交付产品。我正在考虑将[\p{L}\p{M}\p{N}\p{Pc}]*其用作替换文本,但坦率地说,我处于“我不太明白这将要做什么”的地步。我的意思是,我可以阅读规范,但我不相信我可以充分测试它以确保它符合我的预期。我根本不知道要测试的所有边界条件。该应用程序由跨文化工作者使用,其中许多人在部落地区,因此需要支持任何和所有书写系统,包括一些使用零宽度分词的系统。

有没有人有更优雅的解决方案,或者可以确认/更正上面的代码,或者提供一些指针?

谢谢你的帮助。

0 投票
7 回答
330290 浏览

regex - 正则表达式仅匹配整个单词

我有一个正则表达式,用于查找给定内容块中的所有单词,不区分大小写,这些单词包含在存储在数据库中的词汇表中。这是我的模式:

问题是,如果我使用/(Foo)/ithen 这样的词Food得到匹配。单词的两边都需要有空格或单词边界。

如何修改我的表达式以仅匹配Foo句子开头、中间或结尾的单词?

0 投票
3 回答
3180 浏览

mysql - mysql:instr 指定单词边界

我想检查一个字符串是否包含一个字段值作为子字符串。

select * from mytable where instr("mystring", column_name);

但这不会搜索单词边界。

select * from mytable where instr("mystring", concat('[[:<:]]',column_name,'[[:>:]]');

也不起作用。如何纠正这个?

0 投票
2 回答
5633 浏览

regex - 如何使用 XSLT 2.0 和 REGEX(没有 \b 单词边界)在文本中查找单词?

我正在尝试使用 REGEX 扫描一串单词并在 XSLT 2.0 样式表中查找特定单词(不区分大小写)的存在。

我有一个我希望迭代并确定它们是否存在于给定字符串中的单词列表。

我想在给定文本中的任何地方匹配一个单词,但我不想一个单词内匹配(即搜索foo应该匹配“ d”,搜索应该匹配“re ”)。foobarbar

XSLT 2.0 REGEX 没有单词边界(\b),所以我需要尽可能地复制它。

0 投票
4 回答
7559 浏览

php - utf-8中的php正则表达式单词边界匹配

我在 utf-8 php 文件中有以下 php 代码:

我希望最后一个正则表达式只替换完整的单词而不是部分单词。

在我的 Windows 计算机上,它返回:

在网络服务器(linux)上,我得到:

因此,正则表达式在 Windows 上按我预期的那样工作,但在 linux 上却不行。

所以主要问题是,我应该如何编写我的正则表达式以仅在单词边界处匹配?

第二个问题是如何让 Windows 知道我想在我的 php 应用程序中使用 utf-8。