问题标签 [unicode]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
380 浏览

.net - 在 .NET 中查找子字符串匹配的结尾

我正在尝试在与特定文化下的另一个字符串匹配的字符串中查找子字符串的索引(由 System.CultureInfo 提供)。

例如,字符串“ass”匹配德国文化下“straße”中的子字符串“aß”。

我可以使用找到比赛开始的索引

但是在不诉诸蛮力的情况下,是否有一种简单的方法可以识别匹配 2 个字符而不是 3 个字符?

0 投票
3 回答
34888 浏览

sql - MySQL - 用于操作“UNION”的排序规则(utf8_general_ci,COERCIBLE)和(latin1_swedish_ci,IMPLICIT)的非法混合

如何一劳永逸地修复该错误?我只想能够在 MySQL 中进行联合。

(我正在寻找一种捷径,比如让 MySQL 忽略该问题或采取最佳猜测的选项,而不是希望更改 100 个表的排序规则……至少今天不会)

0 投票
1 回答
18197 浏览

javascript - 将带有破折号字符的 punycode 转换为 Unicode

我需要将 punycode 转换NIATO-OTABDnñiñatoñ.

前几天我在 JavaScript中找到了一个文本转换器,但是如果中间有一个破折号,那么 punycode 转换就不起作用。

有什么建议可以解决“破折号”问题吗?

0 投票
5 回答
26830 浏览

c# - 如何将 Unicode 转义序列转换为 .NET 字符串中的 Unicode 字符?

假设您已将文本文件加载到字符串中,并且您希望将所有 Unicode 转义转换为字符串中的实际 Unicode 字符。

例子:

“以下是 Unicode '\u2320' 中整数字符的上半部分,这是下半部分 '\U2321'。”

0 投票
6 回答
14707 浏览

regex - 这些 Unicode 字符(代码点)在这个正则表达式中是什么意思?

我有以下正则表达式:我想出了大部分如下:

在理解验证表达式的最后部分时需要帮助:

任何人都知道这是什么意思?

0 投票
1 回答
1456 浏览

html - MS Office 超链接更改代码页?

当您将以下 URL 粘贴到 IE 中时:http ://technet.microsoft.com/en-us/sysinternals/bb897434.aspx,页面右侧的链接清楚地显示“下载 Zoomit (77 KB)”。如果将链接粘贴到 Office 文档(Word、Excel、PowerPoint - 使用 Office 2003 测试)中,并从文档中激活链接,则相同的文本会拾取几个 A-circumflex 符号。这是因为源 HTML 包含“ ” 被翻译成 Unicode 00A0 的实体(不间断空格)。在 UTF-8 中,这表示为 X'C2A0',然后 X'C2' 显示为 A-circumflex。我不完全理解代码页是如何像这样混在一起的,但我真的很想找到一个 HTML 元 http-equiv 字符集值,它会导致我的包含 nbsp-entity 的页面即使在从办公文件。

0 投票
3 回答
3462 浏览

java - Java、Alfresco Web 服务 API 和 Unicode NamedValues

我正在使用 Java 访问 Alfresco 内容服务器,通过它的 Web 服务 API 将一些内容导入其中。内容应将一些 NamedValue 属性设置为 UTF-8(西里尔文)字符串。我不断收到 Sax 解析器异常:

代码看起来像这样:

有谁知道如何解决这个问题?

0 投票
7 回答
4343 浏览

delphi - 有没有办法在 Delphi 2009 中查看一个字符是使用 1 个字节还是 2 个字节?

Delphi 2009 已将其字符串类型更改为使用 2 个字节来表示一个字符,这允许支持 unicode 字符集。现在当你得到 sizeof(string) 你得到 length(String) * sizeof(char) 。Sizeof(char) 当前为 2。

我感兴趣的是是否有人知道一种方法,它可以逐个字符地找出它是否适合单个字节,例如找出一个char是ascii还是Unicode。

我主要想知道的是,在我的字符串进入数据库(oracle、Documentum)之前,该字符串将使用多少字节。

我们需要能够预先实施限制,理想情况下(因为我们有一个庞大的安装基础),而无需更改数据库。如果字符串字段允许 12 个字节,则在 delphi 2009 中,长度为 7 的字符串将始终显示为使用 14 个字节,即使一旦它到达数据库,它只会使用 7(如果是 ascii)或 14(如果是双字节),或者介于两者之间的某个位置混合物。

0 投票
1 回答
222 浏览

ruby-on-rails - act_as_taggable_on_steroids 的 Unicode 问题

我正在实现一个带有一些法语字符标签的博客。我的问题与如何处理 url 中的空格和 unicode (utf-8) 字符有关。

假设我有一个名为:ohlàlà!我的标签云中有以下代码:

我该如何处理这个问题?

0 投票
16 回答
252611 浏览

python - 如何检查Python中的字符串是否为ASCII?

我想检查一个字符串是否为 ASCII 格式。

我知道ord(),但是当我尝试时ord('é'),我知道了TypeError: ord() expected a character, but string of length 2 found。我知道这是由我构建 Python 的方式引起的(如ord()'s documentation中所述)。

有没有其他方法可以检查?