问题标签 [non-latin]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
158 浏览

php - preg_match 返回与输入字符串不同的符号

[已解决] 如果有人遇到此问题,将修饰符添加/u到正则表达式可解决此问题。在评论中感谢 MI :)

考虑以下代码:

我正在使用它来过滤可能包含非拉丁字符的单词\p{L},还请注意,我没有使用结尾字符串$正则表达式符号preg_match

现在问题来了,在本地执行代码时,我收到以下输出:

我尝试在PHP 沙箱中执行代码,它输出类似的内容:

请注意,至少这一次它没有破坏原来的var_dump单词。

到底是怎么回事?为什么使用 preg_match 会改变单词?最糟糕的是,如果我添加$到正则表达式的末尾,它将NOT MATCH,因为我认为这些转换后的符号不能被解释为字符串结尾或其他东西。请帮我

编辑:我正在运行的文件编码设置为 "text/x-php; charset=utf-8"
Edit2: 另外,我使用了 regex101.com,当使用 REGULAR EXPRESSION "^[\p{L}] +$" 和单词 "Trimiteţi" 似乎匹配。您甚至可以将正则表达式切换为“^([\p{L}]+)$”,添加捕获组,然后站点输出:

0 投票
1 回答
991 浏览

.htaccess - 允许 htaccess 查询字符串验证中的任何字符(非英文字符)

我有这个 htaccess 规则

第四个查询字符串是阿拉伯语,我希望允许任何字符,只要 [0-9a-zA-Z_-] 将仅针对英文字符进行验证。当我使用 (.*) 时,它允许任何英文字符,但是当我插入阿拉伯字符时,我收到 404 错误。那么如何允许 htaccess 验证规则中的任何字符获取阿拉伯值呢?

[更新] 将 htaccess 规则更改为:

现在我没有收到 404 错误,但是当我回显查询字符串值(阿拉伯语)时,我得到空值,当我将其更改为英语时,它工作正常。我尝试将所有查询字符串值更改为阿拉伯语并得到相同的结果:空,因为它根本不存在。

0 投票
1 回答
356 浏览

jquery - jQuery/Ajax - 解码非拉丁数据;如何处理转义的希腊字符

使用 ajaxed 无限滚动时,我无法解码希腊文本。这是我第一次处理非英语数据,但据我了解,每个希腊字符都需要转义,否则 Ajax 会中断尝试发送字符。

我通过使用这个 (PHP) 转义它使其对 Ajax 友好:

所以这

Το γράμμα άλφα (ἄλφα) είναι το πρώτο γράμμα του ελληνικού αλφαβήτου。

变成这样:

Το γÏÏάμμα άλφα (ἄλφα) είναι το Ï€Ïώτο γÏάμÎα τοÏÏ ... ÎµÎ»Î»Î·Î½Î¹ÎºÎ¿Ï Î±Î»Ï†Î±Î²Î®Ï„Î¿Ï...。

这就是文本在我的英国语言环境数据库中的原始外观。但现在我不确定如何在前端将其转换回希腊语。

通常我会在后端使用 PHP 的 utf8_encode 并在前端使用 jQuery 的 decodeURIComponent 成功解码非基本拉丁词,如café、fiancé、façade,但是使用希腊语会出现此错误

URIError:URI 格式错误

是否有内置的 jQuery 函数将 utf-8 转换为另一种在前端支持希腊语的格式?

这是它在默认加载时的样子:

在此处输入图像描述

这就是我尝试通过 Ajax 注入相同文本时发生的情况

在此处输入图像描述

0 投票
0 回答
164 浏览

php - 如何处理非拉丁字符

我有以下 php 代码未返回包含非拉丁字符的图像,因为它们的链接显示奇怪的地址。

我已经<meta charset="utf-8"><head>。我应该如何处理这个问题。

0 投票
1 回答
56 浏览

json - 用于 nan latin 脚本的 Wikipedia API

我正在使用 wikipedia api 从特定标题获取 json 并在我的网页中解析它。我想添加像 wiki 这样的语言翻译器,但所有非拉丁语脚本(如希腊语、中文、日语、希伯来语等)都不起作用。它非常适用于其他语言,如法语、德语等。

我在链接 wikipedia.org/wiki 的前面添加了语言的缩写,例如英语的 en、希腊语的 el 等,并在链接的末尾添加搜索标题。

例如:如果用户提供 albert einstein 作为标题和希腊语作为语言,那么链接将是http://el.wikipedia.org/wiki/albert%20einstein

0 投票
2 回答
962 浏览

pdf - 在 centos 中支持非拉丁字体

我正在尝试以我的语言(希伯来语)将 html 导出为 pdf。html 和导出在我的本地机器 (Mac) 上工作正常。

我正在使用https://github.com/wkhtmltopdf/

在远程机器上(Centos7) html 使用希伯来字体,但导出到 pdf 输出这个

PDF 输出

我试过以下:
 1。

  1. sudo yum install curl cabextract xorg-x11-font-utils fontconfig
  2. sudo yum install liberation-sans-fonts
  3. sudo yum install dejavu-lgc-sans-fonts(来自:https ://gist.github.com/drakakisgeo/7591660 )

没有工作。

的输出locale

有什么建议么?

0 投票
2 回答
2440 浏览

php - 删除所有特殊字符,但不删除非拉丁字符

我将这个 PHP 函数用于 SEO 网址。它适用于拉丁词,但我的网址是西里尔字母。此正则表达式 -/[^a-z0-9_\s-]/不适用于西里尔字符,请帮助我使其适用于非拉丁字符。

0 投票
0 回答
279 浏览

encoding - gedit标准文本文件的奇怪编码

这个问题也发布在 AskUbuntu here中。

我有一个标准文本文件,与 cat 完美搭配:

当我使用 xxd 检查确切的行尾时,我得到了这个:

但是,当我尝试用 gedit 打开它时,我得到了一些非拉丁语言的奇怪编码。gedit 出了什么问题?

编辑

以下是复制的完整源代码:

这是我的编译行:

另外,我附上了 gedit 屏幕的图像文件:

带有非拉丁字母的 gedit prnt scrn

0 投票
1 回答
274 浏览

java - 使用 Java 在 CSV 中写入非拉丁字符

我们已修改应用程序以支持非拉丁字符(中文和泰文),但我们在写入 CSV 时遇到了一些问题,并使用以下方法解决。

上面的一个有效,但我们面临着下面列出的其他一些问题。

  1. 我们使用下面的代码打开了一个 CSV 文件,它工作正常。

    /li>

但是当它用 UTF-8 编写时,我们面临着下面的 excel 问题。

NonLatin.csv 被锁定以供其他用户编辑。打开“只读”或单击“通知”以在文档不再使用时打开并接收通知。或取消。

  1. csv 中的少数条目出现双引号,在应用过滤器时显示为不同的内容。

请建议上述方法(UTF-8)是否有任何限制,或者是否有任何解决方法来处理这个问题。

0 投票
1 回答
348 浏览

vbscript - 如何通过 VBScript 在文本文件中保存非拉丁字符?

中文字符不能通过 VBScript 保存在文本文件中。

VBScript在一个中文名称为:视窗的文件夹中。该脚本将创建一个文本文件,其中将显示当前工作目录。中文字符不能保存在文件中。Windows 脚本宿主说“错误:无效的过程调用或参数”。如果文件夹名称为英文,则不会出现此错误。

VBScript是否可以保存包含中文字符的文件路径?