问题标签 [diacritics]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
16557 浏览

php - 用PHP中的“等效”ASCII替换变音符号?

相关问题:

  1. 如何替换java字符串中的字符?
  2. 如何在 C# 中将特殊字符替换为等价字符(例如“á”代表“a”)?

与上述问题一样,我正在寻找一种可靠、强大的方法来使用 PHP 将任何 unicode 字符减少为接近等效的 ASCII。我真的很想避免滚动自己的查找表。

例如(从第一个引用的问题中窃取):Gračišće变为Gracisce

0 投票
4 回答
10442 浏览

java - Java如何在字符串中添加重音“e”?

在现有帖子Java remove HTML from String without regular expressions中 tucuxi 的帮助下,我构建了一个方法,可以从字符串中解析出任何基本的 HTML 标记。但是,有时原始字符串包含 html 十六进制字符,例如 é(它是重音 e)。我已经开始添加将这些转义字符转换为真实字符的功能。

您可能会问:为什么不使用正则表达式?还是第三方库?不幸的是,我不能,因为我在不支持正则表达式的 BlackBerry 平台上进行开发,而且我从未能够成功地将第三方库添加到我的项目中。

所以,我已经到了将任何 é 替换为“e”的地步。我现在的问题是,如何将实际的“重音 e”添加到字符串中?

这是我的代码:

公共静态字符串removeHTML(字符串概要){

谢谢!

0 投票
2 回答
4156 浏览

php - preg_replace:通配符不匹配变音符号

我想使用 \w 通配符过滤字符串,但不幸的是它不包括变音符号。

但是,我可以将所有字符添加到 preg_replace,但这不是很优雅,因为列表会变得很长。ATM,我只为德语准备这个,但还有更多语言可供选择。

有没有办法一次匹配所有这些?

0 投票
5 回答
35154 浏览

python - 如何在 Python 中用 ascii 字符替换 unicode 字符(给定的 perl 脚本)?

我正在尝试学习 python,但不知道如何将以下 perl 脚本转换为 python:

该脚本只是将 unicode 变音符号更改为替代 ascii 输出。(所以完整的输出在 ascii 中。)我将不胜感激任何提示。谢谢!

0 投票
1 回答
702 浏览

java - FTP 服务器输出和重音

我编写了这个小测试类来连接到 FTP 服务器。

这是输出:

注意列表末尾的目录名称。应该有一个“é”(带有尖锐重音的 e)而不是双字符“é”。

这让我想起了以前在 JSF 中遇到的一个问题,即标准之间的混淆。我对字符编码几乎没有经验,所以我不确定发生了什么。我假设服务器输出是 ASCII 格式,那么如何调整输出以使其正确显示在控制台中?

0 投票
1 回答
2169 浏览

mysql - 全文搜索中的Mysql德语口音不敏感搜索

让我们有一个示例酒店表:

例如,在此表中,我们只有一家酒店的 Region name = "Graubünden"(请注意变音符号 ü 字符)

现在我想为短语实现相同的搜索匹配:“graubunden”和“graubünden”

在常规搜索中使用 MySql 内置排序规则很简单,如下所示:

这适用于“graubunden”和“graubünden”,因此我收到了正确的结果,但问题是当我们进行 MySQL 全文搜索时

这个 SQL 语句有什么问题?:

这不会返回任何结果。有什么想法把狗埋在哪里?

0 投票
1 回答
2466 浏览

python - 输出带有格式良好的重音的json

我有一个烦人的问题,这些天让我很难过......我想开发一些网络服务供我自己使用,目前我正在与我该死的法语口音作斗争,以便在我的 json 输出中正确呈现。

这是我的场景:我从我的数据库中检索了一些我放入字典的行。我接下来要做的是将此 dict 传递给 json.dumps 并输出结果。

问题是:包含重音的字符串被呈现为 utf8,例如它给了我以下输出 \u00e9milie(它应该是 émilie)。令人沮丧的是,如果我打印每个返回的行,重音将在我的浏览器中正确呈现。

问题:

  • 给出这种 json 输出是否正常?
  • 如何“简单”地将包含重音的 dict 转换为 json ?(这对我来说很重要,因为其他网站可以使用我的输出)

这是我正在运行的测试。

0 投票
3 回答
8914 浏览

java - 如何知道字符串是否包含重音符号

如何知道字符串是否包含重音符号?

0 投票
1 回答
9172 浏览

php - 带有 mysql 内容和 utf-8 变音符号的 json_encode

我觉得我的胡须在增长,同时试图在这里找出问题。

基本问题是,变音符号/特殊符号äöß ...不起作用。我想每个人都厌倦了这些问题,但在网上找到的所有解决方案似乎都不起作用。

我在 utf-8 Mysql 数据库中有 utf-8 内容。我觉得问题出在数据库连接的某个地方,但我就是想不通。

character_set_client utf8
character_set_connection utf8
character_set_database utf8
character_set_filesystem 二进制
character_set_results utf8
character_set_server latin1
character_set_system utf8

我不确定问题是否出在 character_set_server 的 latin1 上,因为我不喜欢 mysql 的东西。我也不知道如何更改,因为我无法访问 mysql 服务器的配置文件。

无论让我感到困惑的是,如果我从数据库中获取结果并回显它,print_r 会给出正确的结果。

Firefox 说 char 编码是 utf-8 但如果我输出时:

print_r 结果一切正常,但 json_encode 做错了。

打印_r:

json_encode:

{"id":5,"data":"U-Bahnhof Theresienstra\u00dfe","size":17}

我知道 json_encode 需要一个 utf-8 字符串才能在那里正常工作,我觉得我在这里遇到了编码问题,但我无法确定它在哪里。

任何帮助,将不胜感激,

提前致谢。

i3

0 投票
5 回答
4563 浏览

android - 如何从 InputStream 中删除重音字符

我正在尝试使用 Pull 解析器解析 Android 上的 Rss2.0 提要。

提要 XML 的序言说编码是“utf-8”。当我打开远程流并将其传递给我的 Pull Parser 时,我得到了无效的令牌,记录了格式不正确的异常。

当我保存 XML 文件并在浏览器(FireFox)中打开它时,浏览器报告文件中存在 Unicode 0x12 字符(重音?)并且无法呈现 XML。

假设我对返回的 XML 没有任何控制权,那么处理这种情况的最佳方法是什么?

谢谢。