问题标签 [thai]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
utf-8 - 在 xls2csv -d utf-8 /source.xls >desination.csv 期间将字符 ก 更改为 Ď
当我使用 xls2csv 将 XLS 文件转换为 CSV 时,出现字符“ก”转换为“Ď”的问题。
我的命令是:
泰语和其他语言的其他字符正常工作。
php - 使用 curl php 的泰语编码错误
我正在尝试卷曲此页面并将结果放入 HTML 页面。我使用了这段代码:
当我用浏览器打开它时,创建的 HTML 页面看起来是正确的,但是当我尝试用编辑器打开这个页面时,我看到这样的文本:
而不是这个
mysql - 使用 Pgloader 从 MariaDB 转换后使用带有泰语文本的 tsearch 的 Postgresql 编码问题
我正在尝试将包含泰语和英语的 MySQL UTF8mb4 数据库转换为 Postgresql。在我尝试添加 tsearch 之前,这似乎进展顺利。让我概述所采取的步骤。
- 安装这个泰语解析器https://github.com/zdk/pg-search-thai
- 我从转储文件本地恢复生产副本到 MariaDB
- 修复一些由于丢失而使 Postgresql 出错的枚举值。MariaDB 对他们很满意 :(
将一些多边形转换为文本格式,因为 pgloader 不能优雅地处理它们。- 对新的 postgresql 数据库 testdb 运行 pgloader
pgloader mysql://$MYSQL_USER:$MYSQL_PASSWORD@localhost/$MYSQL_DB postgresql://$PG_USER:$PG_PASSWORD@localhost/testdb
这似乎可行,该站点,一个 Laravel 站点,似乎可以运行,尽管由于 MariaDB 和 Postgresql 约束行为之间的差异,需要修复一些错误。但是,当我尝试为 tsearch 创建文本向量时,我遇到了编码问题。这是我需要建议的地方。
我得到的错误是ERROR: invalid byte sequence for encoding "UTF8": 0x80
如果我转储该表并恢复到新的 Postgresql 数据库中,我不会收到编码错误。
问题:
- 将 UTF8mb4 用于 pgloader 的 Postgresql 的正确编码是什么?
- 除了上述方法之外,还有什么方法可以检查数据是否正确 UTF8?
- 是泰语解析器工具的问题吗?
任何有关如何解决此问题的建议将不胜感激。
干杯,
戈登
PS 我是一位经验丰富的开发人员,但不是经验丰富的 DBA。
pdf - 泰语字符在 PDF 中未正确呈现
我的应用程序应该能够以多种支持的语言输出包含用户指南的 PDF 文件。(我正在使用pdfkit)
我在为泰语找到合适的字体时遇到了一些麻烦:一些所谓的泰语支持的语言(包括来自 Google 的 Noto Thai)会输出正方形、问号甚至更糟糕的不可读的东西。
经过一番研究,我发现一个似乎工作得很好,直到我们的泰国人注意到字符
ต่ำ</p>
如下图所示,基本上第一个字符上方的两个元素折叠在一起,一个覆盖另一个
我正在使用从 myfonts.com 下载的 Nimbus Sans Thai Family,顺便说一下,它似乎能够正确渲染这些字符,因为您可能会喜欢尝试在预览输入中复制粘贴 ต่ำ
有什么提示吗?
php - 搜索输入 GET/POST 数据无法理解来自 MySQL DB 的 utf8_unicode_ci 泰语数据
我在 m MySQL 数据库中有一个泰语内容,带有排序规则 utf8_unicode_ci
我已使用以下内容在我的网页上正确显示
我的数据库连接文件有以下代码
现在的问题是它显示正确,但是如果有人尝试用泰语搜索,我的搜索框无法搜索它,但是使用数据库中存在的英文内容正确搜索
以下是我的搜索代码
delphi - Delphi中泰语UTF-8编码字符串的实际长度
泰语是一种非常特殊的语言。您可以在辅音之后,或在它的前面,或在它的顶部,或在它的底部用任何其他语言写元音(总共 32 个)(好吧,只是短而长的“u”声音可以走到底部,但无论如何......)。
此外,还有其他修饰语(4 个声调标记、ga-ran、mai-tai-ku 和其他修饰语)可以在已经存在的元音之上!
例如:
如您所见,如果我尝试使用等宽字体打印,“实际长度”将为 5 个字符,但所有 UTF-8 strlen 例程都返回 11 个字符 - 这是完全正确的,但我需要当等宽打印时,知道字符串将在屏幕/打印机上使用的“实际空间”。
当然,一个简单的解决方案是列出所有可以放在单词顶部或底部的特殊字符,并将它们从总数中删除。
由于我不确定我能找到所有的特殊字符,是否已经有一个用任何语言制作的例程,以便我可以在 Delphi 中翻译它?
谢谢
c# - C# 在文本框中显示泰语
我正在创建一个将 Unicode 显示到文本框和图片框的应用程序。
当我尝试使用泰语时,我遇到了一些问题,我不会说泰语,但我知道规则允许我拥有一个角色,然后在它之上最多有两个其他标记。
我尝试将以下 Unicode 放入文本框中。0E2c 然后在其上添加 0E36,然后是 0E4B。我已将文本框的字体大小设置为 30。我尝试和自动调整大小的文本框如下注释我尝试添加的高度超出了我的需要,以防万一会有所帮助,但可惜没有。
我想要得到的是,但文本框显示的是注意到顶部的位丢失了。知道如何强制文本框正确显示泰语吗?
我认为 txtbx_text.height 不起作用,因为我将大小增加了 2000 并且没有任何反应。宽度很好,那么如何使高度起作用?
该代码可从http://www.filedropper.com/i-braille获得。选择页面 0e 将高度设置为 30。右键单击每个字符以构建字符串左键单击提供信息。Form1.cs 第 116 行是我试图设置文本框大小的地方。
amp-html - 泰国/泰语是否支持 Google AMP?
在访问曼谷的谷歌总部时,我们了解到泰国是唯一不支持 AMP 的国家。(更具体地说,泰语作为英语页面工作得很好)。
由于这次会议是去年三月,我只是想知道它是否仍然准确?(并希望它不是)。
现在我们将在 PWA 中进行开发,但我想超越并创建一个 AMPWA 8)。
我找不到有关该问题的任何文档,因此欢迎提供任何信息。
谢谢,
python-3.x - 在 Python 中标记泰语文本时出现 UnicodeDecodeError
我正在尝试在 Python 中使用deepcut对泰语文本进行标记,但我收到了 UnicodeDecodeError。
这是我尝试过的
预期输出:
试过:
如何让它显示正确的标记化结果,或者是否有更好的方法来标记泰语文本?