问题标签 [word-boundaries]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
275 浏览

javascript - 是否存在与 Vim 正则表达式开头和结尾的单词原子“\<”和“\>”等效的 JavaScript?

我知道大多数正则表达式引擎,包括 JavaScript 中的引擎,都\b必须匹配单词边界,无论是在单词的开头还是结尾。

但 Vim 还有两个更具体的正则表达式原子:

JavaScript 是否具有这些原子的等价物,如果没有,是否有办法以其他方式表达它们更精确的语义?

0 投票
1 回答
953 浏览

regex - 正则表达式匹配不同 Unicode 脚本之间的边界

0 投票
1 回答
229 浏览

mysql - 使用 [[:<:]][[:>:]] 时是否将空格视为单词边界?

我正在尝试创建一个非常简单的搜索查询,它匹配任何搜索词,但匹配完整的单词,因此部分匹配是不可能的,例如

要查找的字符串是:

匹配的查询可能是:

等等,但不是:

等等,因为这些只是部分匹配。LIKE 在这里没有用,所以我正在尝试使用 REGEXP 和单词边界:

现在的问题是为什么 pt.2 中的边界不覆盖空间,而它们似乎在 pt.3 中(删除圆括号以显示差异)?我在这里想念什么?

谢谢

0 投票
2 回答
80 浏览

c - C结构对齐

我在文件中有一些二进制数据,并将文件加载到内存中char* data。现在我知道例如在偏移 123 处开始一个struct something.

执行以下操作是否安全

然后访问结构的成员。或者我应该做类似的事情

甚至是完全不同的东西?

我的问题主要是动机,因为我对“内存对齐”,“单词边界”等有一些模糊的回忆......

0 投票
3 回答
469 浏览

regex - 通过正则表达式匹配 WORD 模式

假设我有一个很大的段落,其中有一些词就像found field failed fired killed我知道这么多否定词!!

现在,我想获取单词以 or 开头 fi hik以or结尾的行 elded

我将如何在字符串中搜索这种单词模式......??

继续检查我在询问字符串中的单词模式,而不是字符串模式

这2个肯定没用

我承认我不是一个笨拙的人regex,出于基本的理解这样做,所以任何愿意提出更好方法(带有一些描述)的人也是最受欢迎的!:)

0 投票
2 回答
2242 浏览

regex - 单词边界或非数字上的正则表达式匹配

我正在尝试使用 Regex 模式(在 Java 中)来查找 3 位数字的序列,并且连续只有 3 位数字。4位不匹配,2位不匹配。

对我来说明显的模式是:

这与许多源字符串案例相匹配,例如:

但它不会与“abc123def”的源字符串匹配,因为 c/1 边界和 3/d 边界不算作 \b 类所期望的“单词边界”匹配。

我本来希望解决方案是添加一个包含非数字 (\D) 和单词边界 (\b) 的字符类。但这似乎是非法的语法。

有谁知道我可以使用什么表达式来为源字符串情况提取“123”,例如:

我会很感激任何帮助。是的,我意识到在 Java 中必须将 \b 之类的代码双重转义为 \b,但这不是我的问题,我不想将其限制为 Java 人员。

0 投票
1 回答
391 浏览

php - 匹配整个单词,同时使用正则表达式忽略单词的词缀

我正在学习一门新语言,我用 aprox 创建了一个数据库。2500个单词和2500个单词示例。我创建了一个 PHP/MySQL Web UI,基本上显示每个单词的图片,当你点击它们时,它会播放单词的音频。还有一个上下文菜单可以触发一个弹出 div,该 div 匹配并显示该单词出现的所有示例。

我一直在使用 REGEXP '[[:<:]]$word[[:>:]]',但是我想过滤掉几个不会给这个词添加任何真正含义的词的前缀/后缀(比如英语中的后缀 -ing)。我解决这个问题的一种方法是在词缀开始的单词中添加一个连字符,这样正则表达式仍然与该单词匹配,但这并不完全符合语言处理拼写的方式。还有一些不同的词组合我不想过滤,因为意思完全不同。这里没有详细说明,这里有一些伪示例,匹配的单词只是“WORD”以及我想要过滤为的前缀和后缀pre1pre2......和suf1suf2......以及我不想过滤的东西xxx

在上面的示例中,我想匹配 1、2、3、4、5,但我不想匹配 6、7、8、9、10。我开始只是添加 OR 子句,例如:

这适用于一个异常,但有多个异常它会变得混乱。

诚然,我对正则表达式相当缺乏经验,而且我设法解决的大部分内容都是我必须阅读的简单示例。这可以用一个简短而有效的正则表达式来完成吗?

0 投票
3 回答
37 浏览

regex - 用于匹配以特殊字符开头的单词的正则表达式

我试图在字符串中匹配#TEST .. 可以说它的“这是一个#TEST”

执行匹配的脚本自动将搜索字符串包装在 \b 标记中,因此生成的正则表达式将如下所示: \b#TEST\b .. 这显然不起作用。

如何更改搜索字符串以使其正常工作?

编辑:我选择更改包装函数,因此生成的表达式如下所示:

edit2:转义我的文字..

0 投票
4 回答
1941 浏览

c# - 使用数组 c# 去除停用词

我有一个停止词的字符串数组和输入文本的字符串数组,即

现在,我必须使用这些 stopWords 数组从 input_Texts 数组中删除。我使用了以下技术但没有工作,在访问两个数组索引时很奇怪。例如,在 input_Texts 数组的索引 0 处获取第一个文本,即

然后匹配 stopWords 数组中的所有单词字符串,即

然后stopWords从数组的索引 0 中删除所有文本后input_Texts,必须对 input_Texts 数组中的所有文本重复此操作。

任何有修改的建议和代码示例将不胜感激。

谢谢。

0 投票
0 回答
43 浏览

javascript - 是否可以通过 JavaScript 获取东南亚脚本的字边界?

我的目标是将东南亚文本分解成单词,最好是在浏览器中。虽然这对于使用正则表达式或简单地分割空格的西方语言来说是微不足道的,但对于某些脚本来说这是一个更棘手的问题。例如在这一行中找到单词边界:

เขาสามารถทำในสิ่งที่ต้องการต่อไปได้

但是,现代浏览器确实会检测单词边界。这可以通过双击上面的文本来观察。只有行内的单词被突出显示,而不是整个块。从我目前的研究来看,这个词的边界确定是由每个平台上的本地库完成的。是否可以通过 JavaScript 获得这些分词边界?