问题标签 [character-properties]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

93 问题

0 投票

9 回答

94660 浏览

regex - 如何将西里尔字符与正则表达式匹配

如何将法语和俄语西里尔字母字符与正则表达式匹配？我只想做字母字符，没有数字或特殊字符。现在我有

[A-Z-Z]

regex unicode character-properties

2009-11-11T17:01:44.840

0 投票

9 回答

7220 浏览

python - Python：在单词边界上拆分 unicode 字符串

我需要一个字符串，并将其缩短为 140 个字符。

目前我正在做：

所以这对英语和类似英语的字符串很有用，但对于中文字符串却失败了，因为tweet.split()只返回一个数组：

我应该怎么做才能处理 I18N？这对所有语言都有意义吗？

如果这很重要，我在 python 2.5.4 上。

python unicode internationalization character-properties

2009-11-15T20:53:40.807

0 投票

4 回答

1040 浏览

.net - Unicode 中的正则表达式分词器

如何转换正则表达式 \w+ 给我 Unicode 中的整个单词——而不仅仅是 ASCII？

我使用.net

.net regex unicode character-properties

2009-11-25T12:22:05.450

0 投票

6 回答

16923 浏览

python - 匹配 Unicode 属性的 Python 正则表达式

Perl 和其他一些当前的正则表达式引擎在正则表达式中支持 Unicode 属性，例如类别。例如，在 Perl 中，您可以使用\p{Ll}匹配任意小写字母或p{Zs}任何空格分隔符。我在 Python 的 2.x 和 3.x 行中都没有看到对此的支持（很遗憾）。有人知道获得类似效果的好策略吗？欢迎使用本土解决方案。

python regex unicode ucd character-properties

2009-12-02T13:25:41.487

0 投票

3 回答

157 浏览

string - 有没有办法判断 unicode 字符是控件、字母、数字还是符号？

假设您拥有的只是二进制数据并且没有预装函数，那么是否有一种模式或算法来对字符类型进行分类？

string algorithm language-agnostic unicode character-properties

2010-01-02T19:37:49.940

0 投票

2 回答

2048 浏览

php - 正则表达式 - Unicode 属性参考和示例

我对 RegexBuddy 提供的 Regex Unicode 属性感到迷茫，我无法区分任何数字属性和数学符号属性似乎只匹配+但不匹配-，*例如/。^

是否有任何文档/参考与正则表达式 Unicode 属性的示例？

php regex unicode pcre character-properties

2010-01-14T06:17:38.510

0 投票

3 回答

410 浏览

regex - unicode 字符串上的 Mathematica 正则表达式

这是一次令人着迷的调试体验。你能看出以下两行之间的区别吗？

当您评估它们时，它们会做非常不同的事情。事实证明，这是因为第一行中被替换的字符串由一个 unicode 破折号组成，而不是第二行中的普通旧 ascii 破折号。

对于 unicode 字符串，正则表达式不匹配。我的意思是正则表达式“[\s\S]”的意思是“匹配任何字符（包括换行符）”，但 Mathematica 显然将其视为“匹配任何ascii字符”。

如何修复正则表达式，以便上面第一行的计算结果与第二行相同？或者，是否有一个 asciify 过滤器可以先应用于字符串？

PS：Mathematica 文档说它的字符串模式匹配是建立在 Perl 兼容的正则表达式库（http://pcre.org）之上的，所以我遇到的问题可能不是 Mathematica 特有的。

regex debugging wolfram-mathematica pcre character-properties

2010-03-25T02:32:18.880

0 投票

2 回答

2314 浏览

c# - 正则表达式不匹配 Unicode

我将如何使用 Regex 匹配 Unicode 字符串？我正在从一个文本文件中加载几个关键字，并将它们与 Regex 一起用于另一个文件。关键字都包含 unicode（例如á，等）。我不确定问题出在哪里。我必须设置一些选项吗？

代码：

并将关键字读取到列表中：

然后我将数组更改为列表。

c#regex unicode character-properties

2010-03-29T13:31:43.733

0 投票

1 回答

4384 浏览

ruby - 如何在 Ruby 1.9 中为 unicode 西里尔字符指定正则表达式

问题是为什么\w忽略西里尔字符？

我已经从http://rubyinstaller.org/安装了最新的 ruby 包。这是我的输出ruby -v

据我所知 1.9 oniguruma 正则表达式库完全支持 unicode 字符。

ruby regex unicode encoding character-properties

2010-04-27T14:06:18.307

0 投票

2 回答

5490 浏览

ruby - 如何判断一个字符是不是汉字

ruby如何判断一个字符是否为汉字？</p>

ruby unicode encoding cjk character-properties

2010-04-28T08:22:59.330

1 2 3 4 5 6 7 8 9 10