问题标签 [diacritics]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

1050 问题

0 投票

2 回答

3539 浏览

php - 使用 php 脚本将 UMLAUT 插入 mysql 数据库

我正在开发一个脚本，它以 csv 作为输入，然后读取文件并将其内容插入 mysql 数据库。所以问题是在将数据插入数据库时出现的。它将 UMLAUT 转换为随机字符。

仅供参考——我的数据库在 latin_german_ci 中。[我也尝试将其更改为 UTF8]

我能够在 Web 浏览器中显示 UMLAUT 字符，但是当我尝试通过 sql 查询将它们插入数据库时，它会插入随机字符。

请帮忙....

谢谢

2010-05-20T13:24:21.723

0 投票

3 回答

378 浏览

html - 如何处理元标记中的变音符号 (äöü)？

将它们声明为&xuml;etc. 不起作用，只是按原样编写它们会导致显示错误。

该怎么办？

html diacritics

2010-06-03T18:26:06.770

0 投票

2 回答

5329 浏览

c++ - 使用 ICU 去除变音符号的代码

有人可以提供一些示例代码来去除变音符号（即，将具有重音符号、变音符号等的字符替换为它们的未重音符号、未变音符号等，字符等价物，例如，每个重音符号é都会变成纯 ASCII e）从UnicodeString使用C ++中的ICU库？例如：

假设s已经标准化。谢谢。

c++unicode diacritics icu

2010-06-07T18:24:22.377

0 投票

1 回答

386 浏览

erlang - Erlang - 带有重音字符和字符串文字的偏心

我正在尝试实现一个功能来区分法语元音和辅音。这应该是微不足道的，让我们看看我写了什么：

这很简单，但行为不正确：

虽然解释版本运行良好：

这是怎么回事？

erlang diacritics string-literals

2010-06-10T15:33:10.277

0 投票

1 回答

603 浏览

ruby-on-rails - haml / rails：使用德语变音符号产生标题

我想在我的应用程序布局中做这样的事情：

并且在真实的视图中

发生的事情是，我要么得到带有问号的黑色磅 -> 错误的编码，要么得到原始字符串（&UumI;bersicht）。

有谁知道如何让它工作？另一个要求是我想在标题中显示用户生成的内容，并且该内容中可能有也可能没有变音符号。

使用的版本：Haml 3.0.11、Rails 3 beta4 和目前用于开发的 JRuby 1.5

ruby-on-rails haml diacritics

2010-06-12T07:55:25.260

0 投票

2 回答

1847 浏览

postgresql - 如何在 PostgreSQL 和 Umlauts 中使用不区分大小写的模式匹配？

~*当字符串包含非 ASCII 字符（如德语变音符号）时，我试图让 PostgreSQL 8.4.3 与其运算符进行不区分大小写的模式匹配。数据库、终端和其他一切都配置为使用 UTF-8。

简而言之，这是问题：

还有其他变体可以工作：

这些选择都没有让我特别高兴。ILIKE 不使用正则表达式。[Öö] 涉及重写搜索词。LOWER() 可能是最好的解决方法，但我真的很想让~*操作员按预期工作。

提前致谢。

postgresql design-patterns case-insensitive matching diacritics

2010-06-23T19:17:38.440

0 投票

2 回答

1321 浏览

internationalization - 处理元音变字符的不同非重音版本

当用户键入时，德语重音变音符号“ö”、“ä”和“ü”通常被替换为非重音版本，通常是为了方便他们没有正确的键盘。

对于大多数重音字符，有一个大多数人使用的特定非重音版本。例如，重音的“è”总是被标准的“e”代替。

对于 Umlaut 字符，我们的英国用户和美国用户采用的惯例似乎有所不同。

英国用户将分别替换为“o”、“a”和“u”，而
美国用户将分别替换为“oe”、“ae”和“ue”。

我们的搜索建立在Lucene.Net上，并且与任何搜索框架一样，用于匹配所有重音字符组合的技术是在创建索引和提供搜索条件时替换它们，因此允许匹配用纯粹的非重音字符来完成。

我将如何解析重音字符以支持以下...

一位德国客户输入 - “Götz”<br> 一位英国客户输入 - “Gotz”<br> 一位美国客户输入“Goetz”

鉴于该名称在我们的数据库中以正确的“Götz”形式存在，那么我将如何解析“Götz”以便所有三个用户都可以在索引中找到它？

编辑

我在CodeProject上发现这篇文章正是我想要的。该示例显示了如何将单词的同义词添加到 Lucene 索引中，以便它们与原始单词一样匹配。通过一个小的调整，我能够完全按照我的意愿去做。

internationalization lucene lucene.net diacritics

2010-06-25T12:25:39.913

0 投票

3 回答

1616 浏览

unicode - 在 Lucene 中使用变音符号索引和搜索法语文本

我正在使用 Lucene 搜索。

我上传了一个法语文件（french.txt），内容如下。

如果我搜索，francophone那么它会在搜索结果中显示该文件。但是当我搜索multimédiaor françaisorétrangère时，它没有显示任何结果。

我已经尝试使用org.apache.lucene.analysis.fr.FrenchAnalyzer，但它仍然无法正常工作。

我们如何搜索上述的法语单词？

unicode encoding lucene diacritics

2010-06-29T10:53:46.697

0 投票

2 回答

2592 浏览

python - Python regex \w 不匹配组合变音符号？

我有一个包含变音符号的 UTF8 字符串。我想将它与\w正则表达式序列匹配。它匹配具有重音符号的字符，但如果存在带有组合变音符号的拉丁字符，则不匹配。

（看起来 SO 降价处理器在上面的组合变音符号方面遇到了问题，但最后一行有一个 ́）

有没有办法将变音符号与结合起来\w？我不想规范化文本，因为这个文本来自文件名，我还不想做一个完整的“文件名 unicode 规范化”。这是 Python 2.5。

python regex unicode diacritics unicode-normalization

2010-06-29T13:25:11.920

0 投票

8 回答

29226 浏览

php - PHP包含html页面字符集问题

使用下面的代码查询 mysql db 后，我生成了一个 html 文件：

$fh = fopen($myFile, 'w') 或 die("无法打开文件"); fwrite($fh, $row['text']); fclose($fh);

在 msql db 上，文本使用 utf8_general_ci 进行编码。但我需要将它包含在一个 php 网页中，如下所示：

请记住，php 网页在标题上使用 utf8 字符集：

现在，如果我在 db 上写一些带有重音（è àì）或引号字符的字母，然后我直接打开 page.htm 并在 db 上我看到它看起来一切正常，但是当我在 php 页面上查看它时我看到问号 � 字符而不是我最初想要的字符。为什么？！提前致谢！

php character-encoding utf-8 diacritics

2010-07-01T22:38:53.923

1 2 3 4 5 6 7 8 9 10

问题标签 [diacritics]

Reference