问题标签 [non-latin]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1083 浏览

java - 在 Android 键盘中每两个键输出一个字符

我正在为 Android 中的阿姆哈拉语设计一个自定义键盘,但以下内容适用于许多其他非英语语言。

两个或多个键组合转换为一个字符。因此,如果用户键入“S”,键盘将输出“ሰ”......如果他们跟在字母“A”后面,则“ሰ”将替换为“ሳ”。

我设法得到了一个解决方案,如下所示,通过查看光标前的字符并对照地图检查它。但是,我想知道是否有更简单、更清洁的解决方案。

0 投票
1 回答
325 浏览

laravel-4 - 在 pdf 中加载视图时,TCPDF 不显示非拉丁字符

我花了很多时间寻找一个可以在 pdf 文件中显示阿拉伯字符的包,当我终于发现我遇到了另一个问题时。

我在 laravel 4 中使用 TCPDF 包来检索 pdf 文件中的视图并输出它,我的视图包含 TCPDF 无法显示的阿拉伯字符,而不是我得到的文本“????”

请注意,当我对 TCPDF 使用 Text() 方法并插入阿拉伯字母时,它显示正确,因为我将字体设置为 freeserif,但是当我加载刀片视图时情况不同,请查看我的代码:

0 投票
1 回答
793 浏览

python-2.7 - 将俄语字符串转换为日期时间

我正在尝试抓取一个俄罗斯网站。但是我坚持尝试将俄语西里尔字母转换为 DateTime 对象。

让我们以这个 html 片段为例:

我可以通过使用 lxml 来获取这个 div 的内容,即:

所以这个字符串的相关部分是 22 января,即日和月。

为了得到这部分,我正在使用该.split()方法

现在这就是问题所在,我正在尝试将其转换为 DateTime。我尝试使用 DateParser:https ://dateparser.readthedocs.org/en/latest/ ,它应该支持俄语。

但是,None当我将此字符串传递给dateparser.parse()

有没有人遇到过类似的问题?我正在用头撞墙。任何帮助表示赞赏:)

0 投票
0 回答
673 浏览

r - 在 R 中将中文字符转换为拉丁字符

是否可以将非拉丁字符,特别是中文字符转换为拉丁字符?我一直在阅读有关 iconv 功能的信息,但我未能转换。一个简单的例子是,如果我想将此行转换为拉丁字符,

我该怎么做?

0 投票
2 回答
165 浏览

python - 按字符串的顺序对非拉丁字符集进行排序?

我正在使用以下代码表单排序:

对于非拉丁字符,输出与输入相同:

我期待的是:

0 投票
1 回答
928 浏览

c# - 防止 C# 富文本框将亚洲字符转换为十六进制

0 投票
1 回答
299 浏览

html - html 输入字段中的非拉丁字符

我遇到了非拉丁字符的问题。例如,如果我转到下面的链接并输入“ü”并按提交,我会得到 %C3%BC 而不是那个字母。我试过用content="text/html; charset=utf-8 ",但没有用。你们知道我该如何避免这个问题吗?

http://www.w3schools.com/tags/tryit.asp?filename=tryhtml_form_submit

提前致谢

0 投票
2 回答
113 浏览

c - wchar_t 变量仅在 C 中存储乌尔都语字符的一半

我正在尝试从文件中读取和操作乌尔都语文本。但是,似乎没有将字符全部读入wchar_t变量中。这是我的代码,它读取文本并在新行中打印每个字符:

这是我的示例文本:

但是,打印的字符数似乎是文本中字母的两倍。我知道宽或多字节字符使用多个字节,但我认为该wchar_t类型会将与字母表中的字母对应的所有字节存储在一起。

如何阅读文本以便在任何时候都将整个字符存储在变量中?

关于我的环境的详细信息:
gcc:(x86_64-posix-seh-rev0,由 MinGW-W64 项目构建)5.3.0
操作系统:Windows 10 64 位
文本文件编码:UTF-8

这就是我的文本在十六进制格式中的样子:

0 投票
1 回答
378 浏览

php - 当名称字段中使用希腊字符时,联系表单不发送邮件

我有一个非常简单的 html 联系表单,它向用户询问姓名、电子邮件,然后是消息区域。问题是当用户以希腊字符输入他们的名字时(因为该站点是希腊语言),消息永远不会被传递。我彻底测试了一下,发现如果textarea中有希腊字符没有问题,问题只出现在名称字段中。我的联系表格的代码是这个:

如您所见,它调用了一个外部 php 脚本,在搞砸了一整天但没有积极结果之后,它看起来像这样:

我花了一整天的时间做各种各样的实验,但由于我不是程序员,我没能成功。对于任何会以可能的解决方案做出回应的人,请记住,我不是程序员。

0 投票
1 回答
587 浏览

javascript - 对 lunr.js 的希腊语支持

在 lunr 中为希腊词注册新的词干分析器功能无法按预期工作。是我在codepen上的代码。我没有收到任何错误,该功能stemWord()在单独使用时工作正常,但无法阻止 lunr 中的单词。以下是代码示例: