问题标签 [ligature]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
410 浏览

java - 使用正则表达式搜索 unicode 文本

搜索以印地语(天文)(UTF-16)编写的文件会导致以下问题。

该文件包含:

त्रास ततत जुग नींद ना हा बु

请注意,第一个字符“त्र”是 त + ् + र 的多个代码点现在在搜索“त”时,我得到 4 个匹配项,包括第一个字符的 त。我正在使用 Java。

我该如何搜索不属于多个代码点字符的“त”。

任何帮助将不胜感激。:)

0 投票
5 回答
1945 浏览

java - 在 Clojure/Java 中检测 Unicode 文本连字

0 投票
1 回答
8441 浏览

unicode - 什么 LaTeX 命令创建一个 emdash?

我知道我可以用---(和用--)创建一个破折号。但是,我想在我的 Unicode 设置中使用这些字形,并尝试如下:

只是在输出中产生一系列两个或三个破折号。我应该改用什么?我试过\endashand \ndash,但那些不是已知的命令。

0 投票
2 回答
3761 浏览

html - 如何让 Google Font API 中的连字显示在 Google Chrome 中?

我正在使用Google Font API来显示我的网站徽标。(见被盗的camerafinder.com的顶部)

在 Chrome 中,字母 'f' 和 'i' 分别出现,但在 FireFox 中,它们是一个很好的连字

如何强制 Chrome 使用连字?

如果我在 html 中使用连字 ascii 字符 (fi),那么它不会使用字体,它会退回到 arial,但字体(OFL Sorts Mill Goudy TT)必须支持该连字,因为 Firefox 会显示它。

更新:我最终放弃了 Google 字体 API,转而使用普通的 @font-face。无论如何,在 fontsquirrel.com 上有更多选择。

0 投票
4 回答
2477 浏览

java - 在 Mac OS X 上的 Java Swing JComponent 中呈现梵文连字 (Unicode)

我正在尝试在 Mac OS X 10.6 上正确呈现梵文连字(在 Unicode 字符串中)。

字符串绘制在 a 上JComponentRenderingHints用于抗锯齿。连字在 Windows XP SP2 和 7 以及 Ubuntu 中正确显示,但在 Mac OS X 中,连字被分解(或者更确切地说,未正确合并),变音符号被移离其位置等(参见下面的屏幕截图,左侧 Win XP SP2 的正确渲染示例(使用RenderingHintsAntialiasing Key ON),右侧 Mac OS X 10.6.7 的错误渲染示例(Antialising DEFAULT=OFF)。

我已将字体设置如下,因此它应该在任何系统上使用默认字体:

我相信这一切可能与 Mac 上的默认字符编码是 MacRoman(不是 UTF-8 子集),而其他系统(如 Windows)使用 UTF-8 子集(如 WinLatin-1 ) 或 cp1252 等。

即使手头有这些信息,我也不知道如何处理这个问题。因此,如果有人能够指出我正确的方向,我将不胜感激。

相同字符串的正确和错误渲染

我已经尝试了很多事情:

  • 将字体设置为 Devanagari MT 并没有解决问题
  • TextAttribute LIGATURES_ON没有解决问题

我非常感谢其他开发人员的任何提示或代码片段(最好具有在 Mac 上开发的印地语背景)。

0 投票
3 回答
5163 浏览

java - 分隔 Unicode 连字字符

在大量的 unicode 字符中,有一些实际上表示多个字符,例如 U+FB00 连字 ff 表示两个 'f' 字符。有什么方法可以轻松地将这样的字符转换为多个单个字符?最好是标准 Java API 中可用的东西,但如果需要,我可以参考外部库。

0 投票
1 回答
433 浏览

javascript - 比较 HTML5 Canvas 中的两种字体

我正在尝试组合一个工具来检查给定字符是否以指定样式字体或系统默认字体显示。我的最终目标是能够检查,至少在现代(阅读:IE8+)浏览器中,给定字体是否支持连字。

我有两个显示相同连字的画布(在本例中为 st)。我将这些画布转换为数据并比较它们以查看字符是否匹配。

Arial(像大多数字体一样)没有 st 连字,因此它回退到默认的 serif 字体。这就是奇怪的地方:虽然它们显示相同的字体,但两个画布没有相同的数据

为什么?因为它们在画布上的位置并不完全相同。我猜这与字体的不同相对高度有关(一个比另一个略高,尽管字体因字体而异)。差异似乎是一两个像素之一,并且字体因字体而异。

如何解决这个问题?我目前唯一的想法是找到一种方法来测量字体的高度并相应地调整其位置,但不幸的是我不知道该怎么做。我是否可以采取其他方法使这两个图像相同?

你可以看到下面的代码。两个画布都已成功初始化并附加到元素的主体,因此我可以直观地看到正在发生的事情(尽管在我正在处理的实际脚本中这不是必需的)。我已经放弃了初始化和上下文,因为它们都工作得很好。

0 投票
1 回答
318 浏览

itext - 使用 iText 无法正确堆叠藏文和梵文连字

我尝试使用 iText-2.1.7 和 iText-5.1.3 输出一些 Unicode 文本。

虽然天城文字符正确堆叠,但我无法看到藏文字符正确堆叠。

相反,每个字符都占用一个单独的空间。我尝试使用 ARIALUNI.TTF 和 TibMachUni-1.901b.ttf 的 BaseFonts 但没有成功。

谷歌搜索给了我一个2009 年的帖子,这表明当时不太可能。

我被困在一个 Unicode 项目的中间。我将不胜感激获得继续进行的线索。

0 投票
1 回答
2535 浏览

python - 将十六进制字符(连字)转换为 utf-8 字符

0 投票
1 回答
732 浏览

java - 如何在 Java(和其他)中决定“FI”的连字

我们有一个系统可以解析 PDF 文件并提取其中的文本以进行索引等。我们遇到的一个问题是 Illustrator 设置包含“fi”的单词以使用 fi 的连字(单个字形)。

例如这条线...

“长凳和丰富的玻璃化瓷砖。”

在我的 Java 调试器中显示如下

“ete 长凳和丰富的 vitri\u001Fed 瓷砖。”

\u001F 似乎是 Adob​​e PDF 文件用于连字“fi”的字符代码。我显然可以将 \u001F 的出现换成“fi”,但有人知道处理这种情况和类似情况的可靠方法吗?