问题标签 [latin1]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - 我如何将此 UTF-8 字符串编码为 ASCII 以将其插入 latin1 数据库?
我有这个字符串:
dsfssdsdfdsf « ظ...ط¯ظˆظ†ط© ط£طظ...ط¯ ط§ظ„ط®ظˆط§ط¬ط©</p>
它以 UTF-8 编码,我从远程页面中提取它,我使用 file_get_contents 函数获取它的内容,远程页面编码为 UTF-8,
现在我想将此字符串插入其表编码为 latin1 的数据库中,以将其显示到具有字符集 ISO-8859-1 的 html 页面中,
我多次尝试将其编码从 UTF-8 转换为 ASCII 或 TO ISO-8859-1 以及其他编码(如 Windows-1256),但没有成功,字符串出现奇怪字符,请注意默认字符串包含阿拉伯字符,
编码失败结果示例:
dsfssdsdfdsf « Ã〜¸â€¦Ã〜·Â¯Ã〜¸Ë†Ã〜¸â€ Ã〜·© Ã〜 ········································································································································································ Ã,®Ã〜¸Ë†Ã〜·Ã,§Ã〜·Ã,¬Ã〜·Ã,©</p>
dsfssdsdfdsf « ãÏæäÉ ãÍãÏ ÇáÎæÇÌÉ
php - 删除所有内容,除了 PHP 中的字母数字和欧洲字符
我正在验证我的评论脚本,我需要删除所有非字母数字字符,除了在西欧使用的字符。
我的计划是用正则表达式输出所有非字母数字字符:
但到目前为止,所有欧洲字符和一个£符号都被去掉了,所以“Café Rouge”变成了“Caf Rouge”。
如何将一组欧元字符添加到上述正则表达式中。
数组是:
我使用 UTF-8
解决方案:
和
$name aslo 删除标点符号和空格
感谢您的快速回复
mysql - Latin1 数据库中的 UTF-8 数据:可以保存吗?
我有一个从 Android 设备接收数据的 rails 应用程序。我注意到有些数据在日语中没有正确保存。它在 MySQL 客户端和 rails 网站中显示为文字问号(不是菱形问号)。
事实证明,我连接到 rails 应用程序的数据库设置为 Latin1。Rails 设置为 UTF-8。
我读了很多关于字符编码的文章,但他们都提到数据在某种程度上有点可读性。然而,我的只是字面上的问号。还尝试使用网络上的多种方法将数据转换为 UTF-8 并不会改变任何事情。我怀疑数据在写入数据库时会转换为问号。
MySQL 控制台的示例输出:
我的 rails 应用程序从 Android 客户端获得的输入数据是:
在保存到数据库之前,已验证此输入数据存在于 rails 应用程序中。因此,它不会在 Android 客户端或传输到服务器期间被破坏。我有机会取回这些数据吗?还是完全丢失了?
c# - 在 C# 中将 latin1 转换为 UTF8
我想在 C# 中将 latin1 (ISO-8859-1) 转换为 UTF8。做这个的最好方式是什么?
我的字符串是“Công ty TNHH TM và DL Việt Hương”。
utf-8 - 扩展字符集 chars 无法识别并转换为 ? 标记
我有一个包含一些特殊字符的字符串,例如“\u2012”,即图形破折号。当我试图在控制台上打印这个时,我得到一个“?” 标记而不是其符号。我有一个编辑器,我可以在其中使用 alt+numpad 插入符号,例如 alt+2012。在编辑器中,我可以看到符号将其保存在 xml 文件中并使用 nodevalue 获取值,我得到一个“?” 标记。
总结一下,我面临阅读扩展拉丁字符集的问题。我需要的是当我插入这些符号并阅读它时,我应该得到类似 &#xXXXX; 的东西。请帮忙!
蒂亚:)
只是我有一个 String inpath = "À";,我想得到它的 unicode 值..like &#xXXXX;
mysql - MySQL 将排序规则与所有 utf8 db/tables/columns 非法混合
我不明白。我从来没有真正得到它,但现在我真的迷路了。我的数据库是 utf8,我的表是 utf8,我的列是 utf8。有些数据是 latin1/iso-8859-1,所以它只是显示错误。(我现在不在乎。)以前都是 latin1,现在是 50/50,更糟。
当我没有特别告诉连接使用所有 utf8 时,所有查询都有效并且所有数据都正确显示(即使存储错误)。那是因为存储错误(utf8 中的 latin1)并且连接“错误”(我猜默认为 latin1),因此相互抵消。字符正常,没有错误。但显然这是不可接受的,因为数据库包含废话。
所以我想要所有的utf8,所以我专门告诉MySQL(每次第一次查询):
然后不知何故以下查询失败:
出现以下错误:
非法混合排序规则 (utf8_general_ci,COERCIBLE) 和 (latin1_swedish_ci,NUMERIC) 用于操作 '<'
我不明白!哪里来的latin1_swedish_ci,NUMERIC
??HAVING 中的所有部分都不是数字,它们都是相同的 utf8,对吗?源表和列是utf8!
我知道这个查询并不完美,但现在这无关紧要。我应该能够创建假/tmp 列''
并在 HAVING 中比较它们,对吗?
我真的需要我的db是utf8,因为我真的需要我的数据是utf8,因为json_encode真的需要utf8,所以我真的需要连接是utf8。帮助!
python - Python 将 latin1 转换为 UTF8
在 Python 2.7 中,如何将 latin1 字符串转换为 UTF-8。
例如,我正在尝试将 é 转换为 utf-8。
字母是é,它是拉丁小写字母E WITH ACUTE (U+00E9) UTF-8 字节编码为:c3a9
拉丁字节编码为:e9
如何获得拉丁字符串的 UTF-8 编码版本?有人可以举一个如何转换é的例子吗?
java - 瑞典语字符无法正确保存在 MySQL 数据库中
我有一个独立的 java 程序,它以UTF-8 模式打开一个文本文件,并读取文件中包含瑞典字符(如å、ä、ö)的每一行。文本文件已以 utf-8 模式保存。java 程序将从文件中读取的内容打印到标准输出中,并且我已经验证该程序可以正确读取和打印这些特殊字符。然后,程序使用 JDBC 连接将从文件中读取的数据保存到Mysql 5.5数据库中,并使用默认的 utf-8排序规则。
然而,当程序将这些带有瑞典语字符的文本数据插入 mysql 数据库时,特殊字符被替换为不可读的奇怪黑色字符。如果我将数据库排序规则更改为latin1,那么 MySQL 服务器会删除所有这些特殊字符。我用谷歌搜索了这个问题,发现了涉及使用 utf-8 和 latin1 作为默认数据库排序规则的建议,但到目前为止似乎没有一个对我有帮助。
我想知道是否有人在将瑞典语字符放入 mysql 数据库时遇到类似问题?如果是这样,你能告诉我我应该使用什么排序规则类型和字符集来正确地在数据库中包含瑞典字符。我是否必须在 JDBC 数据库连接中进行特定设置才能正确保存这些字母?也许这个问题与 java 相关,但我从视觉上验证了我的 java 程序可以正确读取/打印这些字符。谢谢。
postgresql - Postgres 问题编码“UTF8”在编码“LATIN1”中没有等价物
我们的 postgres 生产数据库服务器有一个名为 crd_production 的数据库,它源于template1
模板数据库。顺便说一句,在 Ubuntu 12.04 机器上,初始创建 pgcluster 时 template1 和 template0 数据库的默认编码具有 LATIN1 的默认编码。我已经删除了template1
数据库并使用 utf-8 编码重新创建了它,如下所示。
我们最终部署了我们的 rails(3.2.11) 应用程序并开始使用crd_production
db 作为主数据库。ActiveRecord 正在写入/读取数据时没有问题,但是当我尝试从psql
该数据库上的命令行触发任何 sql 查询时,会发生以下错误 -
这里可能是什么问题?是客户端的问题吗?
python - 是否存在从 utf8 到 latin-1 的映射?Python
是否存在从 utf8 到 latin-1 和 utf8 中标准化非重音字母的映射?
我一直收到错误,例如:
我正在通过执行以下代码手动解决这些错误中的每一个。有一个更好的方法吗?: