问题标签 [character-properties]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
javascript - 允许所有字母字符加上 unicode 字符的正则表达式
我需要一个正则表达式来允许字符串中的所有字母字符加上希腊/德语字母但替换那些符号?,&,^,"
。和*
我跳过了带有字符的列表以逃避以使问题变得简单。我真的很想看看如何构建它,然后使用 ASCII 代码包含字母集。
regex - 正则表达式 - 搜索以字母开头并以字母或空格结尾的模式
获取仅包含字母的字符串的正确正则表达式是什么,必须以字母和连续的字母字符串开头。但可以以字母或空格结尾(只是空格而不是制表符或回车)。
我有这个模式/^\S*[a-zA-Z]\s*$/
这是正确的吗?我需要\S*
在开头吗?如何确保字母之间没有空格?
TIA
c# - 将名称与 unicode 字符匹配
有人可以帮我在 C# 和 js 中匹配以下类型的字符串“BEREŽALINS”、“GŽIBOVSKIS”吗,我试过了
,等等......但没有任何效果。谢谢
unicode - 如何标记文档中的所有 CJK 文本?
我有一个文件,file1.txt
包含英文、中文、日文和韩文的文本。为了在 ConTeXt 中使用,我需要根据语言(英语除外)标记文件中的每个文本区域,并输出一个新文件,例如,这是一个示例行:
由于其中包含汉字文本,因此将被标记如下:
- 文档保存为 UTF-8。
- 中文文本应标明
\language[cn]{*}
。 - 日文文字应标注
\language[ja]{*}
。 - 韩文文字应标明
\language[ko]{*}
。 - 内容永远不会从一行继续到下一行。
- 如果代码对某些内容是中文、日文还是韩文有疑问,最好默认为中文。
如何根据当前语言标记文本?
unicode - Unicode 通用类别中的 GC=Mark 和 GC=Punctuation 有什么区别?
我无法理解一些概念。在 Unicode 规范中,有一个名为general category的属性。
好的,我了解字母(通常的字符;GC=L
)、数字(如数字 0-9 和其他具有数值的字符;GC=N
)和分隔符(分隔符;GC=Z
)是什么。但是很难区分符号 ( GC=S
)、标点符号 ( GC=P
) 和标记 ( GC=M
)。
我查找了它们的列表,但找不到概念上的差异。而且这份文件对我帮助不大。所有这些有什么区别?
python - 有效地列出给定 Unicode 类别中的所有字符
通常人们想要列出给定 Unicode 类别中的所有字符。例如:
可以通过遍历所有 Unicode 代码点并测试所需类别(Python 3)来生成此列表:
或使用正则表达式,
但是这些方法很慢。有没有一种方法可以查找类别中的字符列表而不必遍历所有字符?
Perl 的相关问题:如何获取具有给定属性的所有 Unicode 字符的列表?
lisp - 如何测试符号中的第一个字符是否是lisp中的字母?
如何测试符号中的第一个字符是否是lisp中的字母?我知道它与 alpha-char-p 函数有关。
vi - 如何使用VI检索文件中特定字符的字符位置?
我需要检索文件中字符的字符位置。我怎样才能做到这一点,使用 Vi?
c# - Unicode 名称正则表达式
我发现了很多关于这个的链接,但没有一个对我有用。我用过\p{Letter}
,它允许空格和数字。
我想要人名的 Unicode 正则表达式。只有英文、拉丁文、俄文、中文和其他欧洲国家等语言的字母,不允许使用数字、空格和特殊符号。有谁能够帮助我?我将在 jquery 验证引擎和 c# 代码中使用它。