问题标签 [cyrillic]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
161 浏览

php - 如何从 SQL 中提取西里尔文数据作为数组并使用 str_replace()

我有代码:

它工作得很好,但有两个问题。首先,我需要将其转换为使用 Joomla API 即类似于

其次,如果 oldword 和 newword 是英文的,它可以工作,但如果是西里尔文,它就不行。我该如何解决?我试过这个:

但此函数仅适用于单个字符串,不适用于数组

0 投票
0 回答
320 浏览

php - 正则表达式西里尔文文件名不匹配

我用 php 列出文件glob(."*.pdf")。所有文件都有西里尔文名称。例如:ООО «Рога и копыта»

然后我从数据库中加载公司名称并尝试在文件名中找到它们: preg_match("/$firm_name/ui", $file_name, $match);

我有一个问题:对于某些公司,即使在$firm_name视觉上类似于$file_name,但 preg_match 表示没有匹配。

两个变量的 mb_detect_encoding 都返回 UTF-8。

很明显是文件名有问题,或者可能是编码什么的,但是我看不懂,请大家帮忙。

升级版:

结果,我得到ОО «Рога и копыта»О缺少一个

0 投票
2 回答
1068 浏览

php - PHP MySQL搜索西里尔字符

我想从西里尔输入优化我的搜索 sql 查询。

如果用户输入“čšž”,则数据库返回带有“čšž”和“csz”的结果。

SQL 或 PHP 应将字符转换为非西里尔字母。

有任何想法吗?

0 投票
1 回答
307 浏览

java - 扫描仪无法处理包含西里尔字符的文件

我正在尝试使用 Scanner 类来解析文本文件。但事实证明,如果文件包含俄语单词,扫描仪根本无法读取该文件。scanner.hasNextLine() 在第一次调用时返回 false。这是 Scanner 类的正常行为吗?我可以做些什么来解决这个问题吗?

0 投票
2 回答
1143 浏览

web-services - SOAP UI 发送包含西里尔字符的附件

我正在开发一个允许用户通过 Web 服务将 XML 文件上传到服务器的应用程序。文件作为附件发送。我正在使用 MTOM。我能够发送和接收文件。问题是我的 XML 文件包含西里尔字母。当我在服务器端打印 XML 时,所有西里尔字母都变成了类似“=D0=9A=D0=95=D0=9D=D0=96=D0=90=D0==9B=D0=98=D0=9D=D0 =9E=D0=92=D0=90”。起初我认为java代码是错误的,我在服务器端读取XML文件附件时使用了错误的编码。为了测试 Web 服务,我使用 SOAPUI。我开始查看请求,发现即使在发送包含文件的请求之前,SOAPUI 已经“弄乱”了附件中的字符。 SOAPUI 中的原始请求

我应该如何设置 SOAPUI 设置以发送正确的请求?

0 投票
1 回答
535 浏览

javascript - 替换 func 与 /b 一起使用时无法识别西里尔字符

我已经为这个问题苦苦挣扎了很长一段时间,该代码适用于拉丁字符,至于西里尔文,jquery 根本无法识别它。

我也尝试过以下代码,但由于某种原因,jQuery 会跳过每个第二个单词并且不将其换行:(

有什么提示吗?

0 投票
2 回答
785 浏览

python - python map减少西里尔文字中的简单字数

我正在尝试使用 MRJob 实现一个非常基本的字数统计示例。使用 ascii 输入一切正常,但是当我将西里尔字母混合到输入中时,我得到类似这样的输出

据我了解,上面的第一行是西里尔字母“мир”的编码单次出现,这是关于我的示例输入文本的正确结果。这是MR代码

我在 Windows 上使用 Python 2.7 和 mrjob 0.4.2。我的问题是:

a)我如何设法在西里尔文输入上正确生成可读的西里尔文输出?b) 这种行为的根本原因是什么——是由于 python/MR 版本还是预计在非 Windows 上的工作方式不同——任何线索?

我正在重现 python -c "p​​rint u'мир'" 的输出

0 投票
1 回答
7355 浏览

ms-access - 捕获 Unicode 文本(西里尔文)并将其插入 MS 访问数据库

我继承了一个旧的 Web 应用程序,它正在使用经典的 ASP 将表单中收集的数据写入 Access 2007 数据库。

现在他们需要它来收集西里尔字母的输入。

我完全不熟悉代码页/字符集,以及使用非拉丁字母。

我尝试将输入表单页面上的字符集更改为 ISO-8859-1 ,它似乎确实存储了字符的 ascii 值(例如:#1076;)。因此,浏览器可以很好地解释和读取它,但是在将该数据导出到 excel 以传递给需要它的部门方面几乎没有用。

所以我的问题是:

有没有一种简单的方法可以从 Web 表单中捕获西里尔字符并将它们作为西里尔字符插入到我的访问表中?

或交替

access 数据库中是否有工具或设置可以将十进制值 (#1076;) 转换为 access 本身内的西里尔字符。

0 投票
1 回答
518 浏览

c# - 将西里尔文文本插入 SQL Server

我需要将西里尔文文本插入 SQL Server 数据库。我正在使用 MVC 4,控制器代码是:

我不知道如何插入西里尔文字...我需要一个在所列代码中工作的解决方案。

0 投票
1 回答
1720 浏览

python - 正则表达式:re.sub()、\b 和西里尔字符

我正在尝试替换文本中西里尔字母的整体外观:

打印“раз два три”,而预期“раз четыре три”。

同时 search() 和 findall() 效果很好:

所以 re.sub() 的唯一问题

拉丁字符效果很好:

如果我尝试以下方式,它会吞下空格(并且看起来很丑:

尝试保留空格不起作用:

替换也无济于事:

打印两次“раздватри”。