问题标签 [character-properties]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
2030 浏览

javascript - 允许所有字母字符加上 unicode 字符的正则表达式

我需要一个正则表达式来允许字符串中的所有字母字符加上希腊/德语字母但替换那些符号?,&,^,"。和*

我跳过了带有字符的列表以逃避以使问题变得简单。我真的很想看看如何构建它,然后使用 ASCII 代码包含字母集。

0 投票
4 回答
4842 浏览

regex - 正则表达式 - 搜索以字母开头并以字母或空格结尾的模式

获取仅包含字母的字符串的正确正则表达式是什么,必须以字母和连续的字母字符串开头。但可以以字母或空格结尾(只是空格而不是制表符或回车)。

我有这个模式/^\S*[a-zA-Z]\s*$/

这是正确的吗?我需要\S*在开头吗?如何确保字母之间没有空格?

TIA

0 投票
2 回答
507 浏览

python - python unicode 正则表达式

0 投票
2 回答
170 浏览

c# - 将名称与 unicode 字符匹配

有人可以帮我在 C# 和 js 中匹配以下类型的字符串“BEREŽALINS”、“GŽIBOVSKIS”吗,我试过了

,等等......但没有任何效果。谢谢

0 投票
3 回答
526 浏览

unicode - 如何标记文档中的所有 CJK 文本?

我有一个文件,file1.txt包含英文、中文、日文和韩文的文本。为了在 ConTeXt 中使用,我需要根据语言(英语除外)标记文件中的每个文本区域,并输出一个新文件,例如,这是一个示例行:

由于其中包含汉字文本,因此将被标记如下:

  • 文档保存为 UTF-8。
  • 中文文本应标明\language[cn]{*}
  • 日文文字应标注\language[ja]{*}
  • 韩文文字应标明\language[ko]{*}
  • 内容永远不会从一行继续到下一行。
  • 如果代码对某些内容是中文、日文还是韩文有疑问,最好默认为中文。

如何根据当前语言标记文本?

0 投票
1 回答
169 浏览

unicode - Unicode 通用类别中的 GC=Mark 和 GC=Punctuation 有什么区别?

我无法理解一些概念。在 Unicode 规范中,有一个名为general category的属性。

好的,我了解字母(通常的字符;GC=L)、数字(如数字 0-9 和其他具有数值的字符;GC=N)和分隔符(分隔符;GC=Z)是什么。但是很难区分符号 ( GC=S)、标点符号 ( GC=P) 和标记 ( GC=M)。

我查找了它们的列表,但找不到概念上的差异。而且这份文件对我帮助不大。所有这些有什么区别?

0 投票
1 回答
3555 浏览

python - 有效地列出给定 Unicode 类别中的所有字符

通常人们想要列出给定 Unicode 类别中的所有字符。例如:

可以通过遍历所有 Unicode 代码点并测试所需类别(Python 3)来生成此列表:

或使用正则表达式,

但是这些方法很慢。有没有一种方法可以查找类别中的字符列表而不必遍历所有字符?

Perl 的相关问题:如何获取具有给定属性的所有 Unicode 字符的列表?

0 投票
1 回答
2152 浏览

lisp - 如何测试符号中的第一个字符是否是lisp中的字母?

如何测试符号中的第一个字符是否是lisp中的字母?我知道它与 alpha-char-p 函数有关。

0 投票
1 回答
3406 浏览

vi - 如何使用VI检索文件中特定字符的字符位置?

我需要检索文件中字符的字符位置。我怎样才能做到这一点,使用 Vi?

0 投票
1 回答
567 浏览

c# - Unicode 名称正则表达式

我发现了很多关于这个的链接,但没有一个对我有用。我用过\p{Letter},它允许空格和数字。

我想要人名的 Unicode 正则表达式。只有英文、拉丁文、俄文、中文和其他欧洲国家等语言的字母,不允许使用数字、空格和特殊符号。有谁能够帮助我?我将在 jquery 验证引擎和 c# 代码中使用它。