问题标签 [non-latin]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - preg_match 返回与输入字符串不同的符号
[已解决] 如果有人遇到此问题,将修饰符添加/u
到正则表达式可解决此问题。在评论中感谢 MI :)
考虑以下代码:
我正在使用它来过滤可能包含非拉丁字符的单词\p{L}
,还请注意,我没有使用结尾字符串$
正则表达式符号preg_match
现在问题来了,在本地执行代码时,我收到以下输出:
我尝试在PHP 沙箱中执行代码,它输出类似的内容:
请注意,至少这一次它没有破坏原来的var_dump
单词。
到底是怎么回事?为什么使用 preg_match 会改变单词?最糟糕的是,如果我添加$
到正则表达式的末尾,它将NOT MATCH,因为我认为这些转换后的符号不能被解释为字符串结尾或其他东西。请帮我
编辑:我正在运行的文件编码设置为 "text/x-php; charset=utf-8"
Edit2: 另外,我使用了 regex101.com,当使用 REGULAR EXPRESSION "^[\p{L}] +$" 和单词 "Trimiteţi" 似乎匹配。您甚至可以将正则表达式切换为“^([\p{L}]+)$”,添加捕获组,然后站点输出:
.htaccess - 允许 htaccess 查询字符串验证中的任何字符(非英文字符)
我有这个 htaccess 规则
第四个查询字符串是阿拉伯语,我希望允许任何字符,只要 [0-9a-zA-Z_-] 将仅针对英文字符进行验证。当我使用 (.*) 时,它允许任何英文字符,但是当我插入阿拉伯字符时,我收到 404 错误。那么如何允许 htaccess 验证规则中的任何字符获取阿拉伯值呢?
[更新] 将 htaccess 规则更改为:
现在我没有收到 404 错误,但是当我回显查询字符串值(阿拉伯语)时,我得到空值,当我将其更改为英语时,它工作正常。我尝试将所有查询字符串值更改为阿拉伯语并得到相同的结果:空,因为它根本不存在。
jquery - jQuery/Ajax - 解码非拉丁数据;如何处理转义的希腊字符
使用 ajaxed 无限滚动时,我无法解码希腊文本。这是我第一次处理非英语数据,但据我了解,每个希腊字符都需要转义,否则 Ajax 会中断尝试发送字符。
我通过使用这个 (PHP) 转义它使其对 Ajax 友好:
所以这
Το γράμμα άλφα (ἄλφα) είναι το πρώτο γράμμα του ελληνικού αλφαβήτου。
变成这样:
Το γÏÏάμμα άλφα (ἄλφα) είναι το Ï€Ïώτο γÏάμÎα τοÏÏ ... ÎµÎ»Î»Î·Î½Î¹ÎºÎ¿Ï Î±Î»Ï†Î±Î²Î®Ï„Î¿Ï...。
这就是文本在我的英国语言环境数据库中的原始外观。但现在我不确定如何在前端将其转换回希腊语。
通常我会在后端使用 PHP 的 utf8_encode 并在前端使用 jQuery 的 decodeURIComponent 成功解码非基本拉丁词,如café、fiancé、façade,但是使用希腊语会出现此错误
URIError:URI 格式错误
是否有内置的 jQuery 函数将 utf-8 转换为另一种在前端支持希腊语的格式?
这是它在默认加载时的样子:
这就是我尝试通过 Ajax 注入相同文本时发生的情况
php - 如何处理非拉丁字符
我有以下 php 代码未返回包含非拉丁字符的图像,因为它们的链接显示奇怪的地址。
我已经<meta charset="utf-8">
在<head>
。我应该如何处理这个问题。
json - 用于 nan latin 脚本的 Wikipedia API
我正在使用 wikipedia api 从特定标题获取 json 并在我的网页中解析它。我想添加像 wiki 这样的语言翻译器,但所有非拉丁语脚本(如希腊语、中文、日语、希伯来语等)都不起作用。它非常适用于其他语言,如法语、德语等。
我在链接 wikipedia.org/wiki 的前面添加了语言的缩写,例如英语的 en、希腊语的 el 等,并在链接的末尾添加搜索标题。
例如:如果用户提供 albert einstein 作为标题和希腊语作为语言,那么链接将是http://el.wikipedia.org/wiki/albert%20einstein。
pdf - 在 centos 中支持非拉丁字体
我正在尝试以我的语言(希伯来语)将 html 导出为 pdf。html 和导出在我的本地机器 (Mac) 上工作正常。
我正在使用https://github.com/wkhtmltopdf/
在远程机器上(Centos7) html 使用希伯来字体,但导出到 pdf 输出这个
我试过以下:
1。
sudo yum install curl cabextract xorg-x11-font-utils fontconfig
sudo yum install liberation-sans-fonts
sudo yum install dejavu-lgc-sans-fonts
(来自:https ://gist.github.com/drakakisgeo/7591660 )
没有工作。
的输出locale
有什么建议么?
php - 删除所有特殊字符,但不删除非拉丁字符
我将这个 PHP 函数用于 SEO 网址。它适用于拉丁词,但我的网址是西里尔字母。此正则表达式 -/[^a-z0-9_\s-]/
不适用于西里尔字符,请帮助我使其适用于非拉丁字符。
encoding - gedit标准文本文件的奇怪编码
这个问题也发布在 AskUbuntu here中。
我有一个标准文本文件,与 cat 完美搭配:
当我使用 xxd 检查确切的行尾时,我得到了这个:
但是,当我尝试用 gedit 打开它时,我得到了一些非拉丁语言的奇怪编码。gedit 出了什么问题?
编辑:
以下是复制的完整源代码:
这是我的编译行:
另外,我附上了 gedit 屏幕的图像文件:
java - 使用 Java 在 CSV 中写入非拉丁字符
我们已修改应用程序以支持非拉丁字符(中文和泰文),但我们在写入 CSV 时遇到了一些问题,并使用以下方法解决。
上面的一个有效,但我们面临着下面列出的其他一些问题。
我们使用下面的代码打开了一个 CSV 文件,它工作正常。
/li>
但是当它用 UTF-8 编写时,我们面临着下面的 excel 问题。
NonLatin.csv 被锁定以供其他用户编辑。打开“只读”或单击“通知”以在文档不再使用时打开并接收通知。或取消。
- csv 中的少数条目出现双引号,在应用过滤器时显示为不同的内容。
请建议上述方法(UTF-8)是否有任何限制,或者是否有任何解决方法来处理这个问题。
vbscript - 如何通过 VBScript 在文本文件中保存非拉丁字符?
中文字符不能通过 VBScript 保存在文本文件中。
VBScript在一个中文名称为:视窗的文件夹中。该脚本将创建一个文本文件,其中将显示当前工作目录。中文字符不能保存在文件中。Windows 脚本宿主说“错误:无效的过程调用或参数”。如果文件夹名称为英文,则不会出现此错误。
VBScript是否可以保存包含中文字符的文件路径?