问题标签 [non-ascii-characters]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
706 浏览

sql - mysql 查询以查找表列中每次出现的非 ascii 字符并将其替换为其等效的 HTML

我有一列包含 HTML 字符串,其中包含 ® 和 ™ 等字符。我想用它们的 HTML 等价物替换所有这些字符。这可能吗?

0 投票
1 回答
638 浏览

java - 在 java 中处理特殊字符,例如 ^ÛY、^ÛR

有没有人遇到过特殊字符,例如 ^ÛY、^ÛR ?

Q1。如何对包含这些字符的文件进行 ftp?一旦我在 AIX(bi 或 ascii)上执行 ftp,就看不到这些字符,因此我无法看到我的程序来替换这些,工作。

Q2。如果我在文件中显式搜索这些 (^ÛY, ^ÛR )​​,我的 java 程序似乎无法识别或替换这些,但是使用正则表达式的替换似乎有效(我只能看到长度的差异细绳)。我的程序在 AIX 上执行。java为什么不能识别这些的任何见解?

Q3。Oracle 数据库能识别这些字符吗?更新失败,我的程序指示字符串长度较短且没有这些字符,但数据库抱怨“值对于列来说太大”,因为要更新的字符串包含这些字符,因此更长。

提前致谢,

RJ

0 投票
1 回答
151 浏览

doctrine - 可使用非 ASCII 字符搜索的教义

我有土耳其语文本:“selam günaydın”。Doctrine searchable 将其转换为表中的关键字:-selam -guenaydin

所以“guenaydin”作为关键字“günaydın”被保存在表格中,所以当有人在搜索“günaydın”中写道时,他什么也得不到——我能做什么?

0 投票
3 回答
3076 浏览

python - 帮助在 Python 中替换非 ASCII 字符

我有一堆使用 Python 中的 HTTPLIB2 包下载的 HTML 文件。' ' 显示为 'Â '。

如何在 Python 中'Â '替换为?' '非常感谢!

0 投票
1 回答
177 浏览

winforms - 文本文件中的非英语字母数字

C# WinForm 应用程序

编辑: 似乎有人担心外语兼容性。
这是一个非问题。 我制作这个实用程序的纸牌游戏主要是英文的。将来我可能会支持其他语言,但一切仍将关闭英文名称,这是程序和游戏规则的主键
我可以简单地添加带有英文名称的附加表格,后跟翻译文本,一切都应该没问题。

.

我的程序的一部分从包含名称的文本文件中读取输入,并将其与另一个名称列表进行比较。有时这些名称包含非英语字母,尤其是输入文件中的重音“o”和拉丁语 AE。

当将此文本输入与名称进行比较时,那些非英文字符会导致问题。在大多数情况下,我想找到一种方法将这些字符与英文对应物重叠,例如“[accented o]”->“o”

.

我完全满足于编写一个查找/替换表(我只希望有 12-30 个问题字符),但我遇到了一些障碍。

1)硬编码查找/替换表(在“.cs”文件中)会给我错误,因为编译器不喜欢这些字符。
任何人都知道解决此问题的技巧,还是我只需要创建一个在此过程之前将读取的查找/替换文本文件?

2)识别字母令人沮丧,但如果找不到匹配项,我只会使用替换逻辑。当非英语字符导致不匹配,或者它不在列表中时,就会发生这种情况。
我不太担心对每个不匹配的字符串逐个字符检查效率低下,因为这是每三个月触发一次的手动更新过程。大概下降到单个字符的二进制代码级别应该可以工作,但我还没有让这个工作。

3)前面提到的[AE]字符经常被使用,至少允许在程序中使用这个字符会很好,因为我不打算像其他人那样替换它。我已经毫无问题地将 [AE] 字符加载到我的数据库中,并且使用“Ae”、“AE”和“[AE]”进行的搜索在 SQL 级别没有造成任何问题,所以我对那个功能很好.
只是搜索其他非英文字符不太直观。

.

所以这是我的问题,这实际上比任何严重的事情都更令人讨厌。尽管如此,任何帮助或建议将不胜感激。

0 投票
1 回答
468 浏览

java - Java (Groovy) LDAP 非 ASCII 字符

我一直在谷歌搜索我的屁股没有任何成功。所以我来到了这里。希望有人可以帮助我!我使用 Groovy 进行一些 LDAP 搜索,但是当一个人的名字中有 å、ä 或 ö 时,我会得到例如 Jens R√§fteg√•rd。我试过了:

新字符串(attrs.get("name")?.get(0)?.getBytes(), "UTF-8")

甚至尝试过:

def charsets = Charset.availableCharsets() charsets.each() { key, value -> value.aliases().each() { alias -> println new String(attrs.get("name")?.get(0) ?.getBytes(), 别名) } }

有人有线索吗?

0 投票
21 回答
192160 浏览

php - 替换重音字符php

我正在尝试用普通替换替换重音字符。以下是我目前正在做的事情。

这给了我:

以上给了我ric cantona我想要的输出eric cantona

谁能帮我解决我哪里出错了?

0 投票
2 回答
827 浏览

java - 正则表达式在java中替换“节字符”

我正在运行一系列正则表达式替换(即 String.replaceAll 调用)以将文本文件中的所有特殊字符转换为 XML 可解析的特殊字符。例如:

我遇到了替换“节字符”的绊脚石,即这个小曲线:§

对于初学者,我在 vi 中进行编辑,所以我什至无法将字符粘贴到那里,它不是标准或扩展 ascii 的成员。出于同样的原因,我也看不到在正则表达式中通过十六进制代码指定它。

您将如何为正则表达式替换指定此字符?或者,如果你只是想顺便告诉我已经有一个函数隐藏在某个地方来进行我正在手动进行的字符转换,那也很酷。

0 投票
2 回答
3647 浏览

php - 如何删除虚假的非 ascii 字符,但保留空格和换行符?

我有一些包含一些非 ASCII 字符的文本文件,我想删除它们,但保留格式字符。

我试过了

然而,这似乎去除了换行符和其他格式,并且一些希伯来语也有问题,然后将其转换为

משפטים נוספים מהמומחה。נסוותהנו!חג חנוכה שמח **************************************** חדש - האפליקציה היחידה שאומרת לך מה מצב הסוללה שלך ** 1.1 版新功能 - 专家会谈!!!*

对此

1.4 :", ..."" ..."" 50 ..." 。, . !****************************************** - ** 1.1 版新增功能 - 专家会谈!!!*

0 投票
7 回答
7191 浏览

php - 将非 ASCII 字符打印到 CSV 文件中

我正在尝试使用 php 创建一个 CSV 文件。如何打印非 ascii 字符?