问题标签 [combining-marks]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
785 浏览

java - 哪个组件处理字符串中的组合分音器?

我正在使用 Java 中的文件名列表。

我观察到文件名中的一些单个字符,例如 a、ö 和 ü 实际上由一个序列组成,您可以将其描述为两个单个 ASCII 字符:

ö由 表示o¨

我通过检查看到这一点codePointAt()。德语名称“Rölli”实际上是“Ro¨lli”:

¨上面日志中的字符的值为 776,即“组合分音”。这是一个所谓的组合标记,属于字素,或者更确切地说属于组合变音符号。所以这一切都是有道理的,但我不明白是什么软件组件将这两个字符组合成一个变音符号,以及在哪里指定了这种行为。

  • 这与强大的字符代码表使用几个字节作为内部表示这一事实无关。几个字节与两个组合字符不同。
  • 任何简单print()的字符串都会向我显示组合字符,因此它既不是上面的某个 UI 层。
  • 我记得用 PHP 也观察到了这一点。我想任何现代语言都可以处理这个问题。

什么组件导致组合字符显示为单个组合字符?这一切有多可靠?

Java是否有一种规范化方法,可以使组合代码点的单个代码点像这里一样?将有助于使用正则表达式...

非常感谢任何提示。

0 投票
3 回答
1517 浏览

input - 如何用 Hangul Jamo 组成音节块

我正在做一个需要输入旧韩文音节块的项目(即韩文音节块,它将使用位于韩文兼容性 Jamo unicode 块中的过时字符,例如ㆅ和ㅿ),但我一直有很难将块显示为整个块(如 룰)而不是一串单独的字形(如 ᅘᆇᇈ)。显然,字符串ㄱㅏㅁ、가ㅁ和감是等价的,但韩文字体的“GSUB特征”在不同程度上将它们联系在一起。根据我收集到的信息,类似的过程适用于 Hangul Jamo,其中猜测块是如何由后面的元音形成的(就像 구 和 기 中的 ㄱ 之间的区别)以及它是否有最终辅音(就像 가 和 갈 中的ㄱ之间的区别)。

我想这类似于组合变音符号的工作方式,它会猜测大写字母 Á 和小写字母 á 的高度差。有很多拉丁字体不支持组合字符,考虑到虽然ㄱㅏㅁ、가ㅁ和감是相等的,但到底감是一个预先组合的字符,而Hangul Jamo unicode块的全部目的是(根据维基百科关于它的文章)“用于动态组合在 Unicode 中不能作为预先组合的韩文音节使用的音节,特别是包含在现代发音中与其他声音在语音上合并的声音的古老音节。” 这让我想知道 Hangul Jamo 的行为是否更像需要 { EQ \o(X1,X2) } 与它们各自的字符组合的空间修改字符。

我读过的大部分内容都是关于字体设计和命令行的,这使得作者似乎所做的不仅仅是在文字处理器上输入过时的字符,但请注意:https ://github.com/adobe-字体/source-han-sans/issues/34。发帖人和解说员都在想办法以竖版的形式拼写Hangul Jamo,但他们已经在文字处理器中水平拼写了音节块,但怎么看都看不到。

0 投票
1 回答
1058 浏览

javascript - 加入函数 onclick 和 onkeyup

我刚刚和一位经验丰富的开发人员一起检查了我的代码,他做了很多非常有用的更改,但是,不幸的是,代码没有正确保存,我丢失了所有的编辑!!!

他帮助的主要事情是消除了我的一些代码重复。我有两个共享大量代码的函数: //使用“添加”按钮将项目添加到待办事项列表和 //使用 ENTER KEY 将项目添加到列表。

他为此所做的是将这些函数的大部分添加到 //Add new item to To-Do List 函数中,这样其他函数就更简单了。不过我忘了他是怎么做到的!如果有人可以提供帮助,我将不胜感激!

这是小提琴:https ://jsfiddle.net/Rassisland/7bkcLfhu/

0 投票
1 回答
381 浏览

.net - 获取泰语组合字符的正确图形表示

我正在尝试编写一种可以呈现泰语(以及其他)的位图字体。我有字符集,但很多字符都是“组合字符”代码点。我正在使用 Graphics.DrawString 来获取字符的位图。这适用于拉丁文、西里尔文和越南文。

但是,当我渲染一个单独的组合字符时,Windows .Net 在组合字符下方呈现一个虚线圆圈,如下所示:泰文字符

有没有办法删除这些圈子?(他们并不总是在同一个地方)

这是我现在使用的代码:

0 投票
0 回答
417 浏览

unicode - 哪些平台支持围绕现有表情符号呈现 Unicode 组合字符⃠?

我正在尝试确定哪些平台支持在预先存在的表情符号周围添加 Unicode 字符 COMBINING ENCLOSING CIRCLE BACKSLASH (⃠)。我能找到的关于将这个组合字符与表情符号结合使用的唯一文档来自Unicode Tech Report #51

组合标记可以应用于表情符号,就像它们可以应用于其他字符一样。完成后,组合应呈现表情符号。例如,1⃣ 表示为序列“1”加上表情符号变体选择器加上 U+20E3 COMBINING ENCLOSING KEYCAP。然而,系统不太可能支持任意组合标记与任意表情符号。除了 U+20E3,最有可能被支持的是:

  • U+20E0 组合封闭圆反斜杠,作为叠加的⃠,表示禁止或“否”</li>

例如:

  • ⃠ 没有麦克风
  • ⃠ 无闪烁
  • ⃠ 无枪 建议使用除 U+20E0 和 U+20E3 以外的组合标记。

注意:您的平台/浏览器组合,就像我的一样,可能会将其中的每一个作为示例呈现为两个不同的字符。哪些平台支持将它们渲染为一个字符?

0 投票
0 回答
199 浏览

vim - 在 Emacs 和 Vim 中分别渲染组合字符

默认情况下,Sublime Text 将 Unicode 字符组合呈现为单独的字符。

例如,
字符串"a̅c"( U+0061, U+0305, U+0063) 显示为:组合渲染(在正文中,而不是选项卡中)。有没有办法在 Emacs 中复制这种行为?在 Vim 中?

0 投票
1 回答
31 浏览

r - 使用R过滤来自一个表的信息以与另一个表的信息组合

有人可以帮我解决这个技巧吗?我有两张表,如下所示(data1 和 data2)。我想输出(data3)两者结合。这个想法是从data1的每个“mir”(mir.1,mir2,...,mir25)中只选择负值,结合来自data2的各个“mir”的信息来生成data3。

示例:

预期结果:

0 投票
0 回答
558 浏览

python - python使用unicode结合overline

我正在使用 reportlab 创建工程计算的 pdf 文档。我坚持正在实现的代码中使用的符号。这主要使用拉丁字母和希腊字母、下标和上标。对于这些,我实现了一个非常简单的方法,该方法基于在生成 pdf 之前将文本中的某些字符串替换为 unicode 字符。它可以以其他方式完成,但它有效。然而,一个问题让我难以理解:使用组合字符创建字符,特别是带有横条的字符,例如带有横条的拉丁语“d”。

在 python 控制台中生成“b”旁边的栏(注意在 stackoverflow 的编辑器中结果与预期的一样:-))。但是,在控制台中使用重音的方法相同:

任何想法我的错误在哪里?

0 投票
0 回答
129 浏览

haskell - haskell 是否支持 unicode 组合字符?

我查看了 haskell 的词法规范,我可以使用小写的 unicode 字符作为有效的变量名。

我相信使用带有小写字母的修饰符是不合法的吗?迄今为止的尝试表明没有。这个 stackoverflow 帖子还表明这是一个无首发:Link1

我认为当 Haskell 支持 unicode 时,这是经过深思熟虑的。谁能建议为什么不呢?这是一个糟糕的想法,还是没有人能够接受的事情?

0 投票
1 回答
108 浏览

fonts - 如何在 UFO 3 中使用组合字符?

我通过以统一字体对象 3格式编写 XML 文件来创建字体。

有点不清楚如何在格式中创建组合字符,所以我希望有人可以通过一个简单的例子为我指出正确的方向?

就我而言,我使用的是 Unicode 的私人使用区域(U+E000-U+F8FF)。例如,如果一个接一个地键入,我想U+E000U+E001显示在彼此之上。