问题标签 [cyrillic]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python - 处理 Unicode(俄语)Txt 文件
在过去的几个小时里,我一直在用俄语制表符分隔的 txt 文件感到困惑。这是它的样子:
目标是解析 txt 文件,现在分别打印每个关键字。
到目前为止,我有:
但我不断收到以下错误:
UnicodeDecodeError:“utf-8”编解码器无法解码位置 0 的字节 0xff:无效的起始字节
另外,如果我执行 len(vals) 来查看每个列表的长度,我会得到以下信息: 4 1 4 1 这可能意味着 split("\") 不起作用?
我正在使用 Python3.3 和 mac。
最后,我认为 Mac 上的命令行不显示西里尔字符不是问题——它之前已经做到了,没有问题(西方 Windows 版本似乎在这方面失败了)。
请让我知道我做错了什么。
谢谢!
python - Python字母重复替换Unicode字符串
我需要替换字符串中的两个输入错误的字母,例如“bbig”。但它仅适用于拉丁字母,不适用于西里尔字母。我在 Centos Linux 下使用 Python 2.6.6 版本。
上面的代码返回:
- ББООЛЛЬЬШШООЙЙ
- 大的
我做错了什么?谢谢你的帮助。
java - 带有西里尔字符的文件路径的 Java java.io.filenotfoundexception
我有一个文件,其名称不仅包含来自纯 ASCII 字符集的字符,还包含来自非 ASCII 字符集的字符。就我而言,它包含西里尔字符。
这是我的代码片段:
块中的代码sendFile.exists
if
没有被执行。
为什么无法识别文件?
我的系统配置 语言环境
unname -a
java版本
更新
我发现这个错误出现在 Oracle 的 JDK 上。
我在 Eclipse 上创建了项目,并找到了文件。我检查了项目属性并找到了 Mac OS 6 JDK。
然后我将其更改为 JDK 7,并且再次找不到文件。
我的问题是我需要将 JDK 7 与 JavaFX 一起使用。不是 Mac OS 版本。所以我的问题仍然存在。
我制作了一个视频来显示这个错误 视频有错误
更新 2
感谢 eumust 的回答,此代码有效:
regex - 匹配俄语的正则表达式,允许 .htaccess 中的所有西里尔字符
我如何将带有俄罗斯蛞蝓的 url 重定向到特定的 php 页面。例如我有这个网址。
并想在 .htaccess 中重定向到这个
javascript - Google Places API - 按西里尔参数搜索地名
我正在使用 Google Places API 发送对我周围地点的请求,并且我将“名称”参数设置为按地点名称进行过滤。
问题是这一切都适用于拉丁名字,但我想搜索用我的母语(使用西里尔字符)写的地方,当我这样做时它不会返回任何结果。我曾尝试在 javascript 中使用一个名为 encodeURI(string) 的函数,但它没有帮助。甚至可以执行这种搜索吗?
};
它适用于“bazen”,但不适用于“базен”(名称参数)。
linux - Mercurial 克隆俄罗斯符号,如“?”
我在 PuTTy 的 Linux Red Hat 4.1.2-48 中工作,其中设置编码 UTF-8(PuTTy)。我安装了 mercurial 2.2.1 和他的存储库。在存储库编码集 UTF-8 的“hgrc”文件中,例如:
在存储库中,我有文件,其名称采用 utf-8 编码,并带有俄语符号。当我转到存储库目录时,我看到正确的俄语符号。在 Linux 环境变量LANG=en_US.UTF-8.
中。
如果我在 Windows 7 上克隆这个存储库,我有正确的俄罗斯符号,一切都很好。但是,如果我在那个 Linux 上克隆,所有的俄语符号都会变成“?” 特点。当我执行命令file -bi
时,它说它是 utf8。
任何人都可以帮助解决这个问题,俄罗斯字符是俄罗斯人还是说问题的方向?
java - 任何从 Unicode 编码到 CP866 的免费软件 java 库?
我正在尝试打印到仅支持 CP866 编码的设备。
不幸的是,我正在打印的设备(Android 设备)不支持 CP866,"abc".getBytes("CP866")
导致UnsupportedEncodingException
.
所以,我想,我必须对自己Unicode
进行CP866
编码。是否有任何免费软件 java 库可以做到这一点?
java - 无法打印俄语字符
我有一个已编码为 UTF-8 的俄语字符串
当我在 Eclipse 控制台中打印字符串时,我得到??
任何人都可以建议如何将俄语字符串打印到控制台或我在这里做错了什么?
我尝试使用将其转换为字节byte myArr[] = str.getBytes("UTF-8")
,然后new String(myArr, "UTF-8")
仍然是同样的问题:-(
php - 使用 ttf2ufm 使 R&OS PDF 0.11.6 支持 Cyrillic,我必须做些什么?
我参与了 Netbeans 中一个相当大而复杂的 svn 项目。我对 PHP 的经验并不丰富,更像是基础知识水平。我坚持为使用保加利亚语(西里尔文win1251
或koi8-r
)的客户呈现 PDF 报告文件。
我使用的 PDF 创建类是 R&OS PDF 类(Cpdf.php
& Cezpdf.php
, Cezpdf
extends Cpdf
),最近更新为0.11.6
,支持 UTF-8。
根据课程的手册,我必须使用ttf2ufm
(从存储库安装它)来编码字体或其他东西。
我想使用的字体是 Helvetica 或 Times Roman,没什么复杂的。它已经包含在类的字体文件夹中。
如果有人可以向我解释这一点,那会为我节省很多时间,而且我们都知道时间总是很短:)
python - 如何在 python IMAP 搜索中使用西里尔字母?
如何在 imapObj.search() 中使用西里尔符号?我正在执行以下 IMAP 搜索:
它不起作用。