问题标签 [windows-1255]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
73 浏览

vbscript - 观看????在预览通过电子邮件发送的网页而不是希伯来语

显示页面时出现问题 ???? (问号)而不是希伯来语字符,mssql 表 (html) 中的数据是可以的,它只发生在新的迁移站点到新的托管站点本身在希伯来语中看起来很完美。仅创建有问题的页面,例如时事通讯电子邮件、订单详细信息电子邮件等

我正在使用代码页 Windows 希伯来语 1255

这在处理写入 html 页面的 asp 页面中的代码中 此代码在标题页 asp <%@ LANGUAGE = "VBScript" codepage=1255%> 可能是什么原因导致此问题

请指教谢谢

0 投票
2 回答
962 浏览

java - Java减去字符串中字符代码的值

我正在尝试将字符串转换为希伯来语编码(windows 1255),所以我需要从任何 char 1264 的值中减去并放入新字符串中。

这是我要转换的 javascript 代码:

这就是我用 Java 做的,但我没有得到预期的价值:

我究竟做错了什么?

0 投票
1 回答
4670 浏览

google-apps-script - 使用 Google Apps 脚本从网页中提取数据时出现字符编码问题

我使用 Google Apps 脚本编写了一个脚本,用于将网页中的文本提取到 Google 表格中。我只需要这个脚本来处理特定的网页,所以它不需要多才多艺。该脚本几乎完全按照我的意愿工作,只是我遇到了字符编码问题。我正在提取希伯来语和英语文本。HTML 中的元标记具有 charset=Windows-1255。英语完美提取,但希伯来语显示为包含问号的黑色菱形。

我发现这个问题说将数据传递到 blob 然后使用 getDataAsString 方法转换为另一种编码。我尝试转换为不同的编码并得到不同的结果。UTF-8 显示带有问号的黑色菱形,UTF-16 显示韩文,ISO 8859-8 返回错误并说它不是有效参数,原始 Windows-1255 显示一个希伯来字符,但还有一堆其他乱码。

但是,我可以手动将希伯来语文本复制并粘贴到 Google 表格中,并且可以正确显示。

我什至测试了直接从 Google Apps 脚本代码传递希伯来语,如下所示:

这会在 Google 表格上正确显示希伯来文文本。

希伯来语显示为我提到的每种编码

我的代码如下:

我忽略、误解或做错了什么?我对编码的工作原理不太了解,所以我不明白为什么将其转换为 UTF-8 不起作用。

0 投票
1 回答
1300 浏览

node.js - 在 Node JS 中从 Windows-1255 转换为 UTF-8

我正在使用 Node.js 从 Windows-1255 编码的网页中提取文本。我正在尝试使用windows-1255解码文本。

在使用 NPM 安装它并在相关文件中要求它之后,我尝试像这样使用它:

这似乎没有任何效果。知道为什么吗?

谢谢!

摩根

0 投票
0 回答
126 浏览

c++ - 如何将 std::string 转换为 windows-1255 字节?

我有一个接收希伯来语字符串并通过串行端口(boost asio)将其发送到设备的函数:

设备无法正确显示文本消息,因为它使用 windows-1255 编码。如何将 std::string 转换为 windows-1255 字节?

0 投票
2 回答
967 浏览

node.js - 将 rss 编码从 windows 1255 转换为 utf 8 node js

我正在尝试像这样解析希伯来语 rss: http ://rss.walla.co.il/?w=/3/0/12/@rss.e

我正在使用 feedparser 和 request,问题是编码是 windows-1255 而不是 UTF-8

所以我看到的文字是:������������,而不是普通的希伯来文。

我尝试了一些转换(如 iconv-lite),但没有成功。

这是我的代码:

}

这就是它打印的内容: text = ן¿½ן¿½ן¿½ן¿½ן¿½!ן¿½ן¿½ן¿½ן¿½ן¿½ - ן¿½ן¿½ן¿½ן¿½ן¿½

0 投票
0 回答
110 浏览

unicode - RLO unicode 字符不适用于 windows1255

是否有另一个类似的字符\u202e导致相同的功能 - windows1255 也支持从右到左的覆盖?

到目前为止我已经使用过\u202e,但是现在,当将文本发送到使用 windows1255 编码的系统时,文本会用问号替换那些 - ???

如何在 windows1255 编码中具有相同的功能?

0 投票
1 回答
235 浏览

sql - 如何从混合编码文件导入 PostgreSQL 表

我有一个 30 GB 的文本文件。该文件的编码是 UTF8,但它也包含一些 Windows-1252 字符。因此,当我尝试导入时,会出现以下错误:

我怎样才能解决这个问题?

该文件已经具有 UTF8 格式,当我为此文件运行“文件”命令时,它说编码是 UTF8。但它也包含一些非 UTF8 字节序列。例如,当我在一段时间后运行 \copy 命令时,它会为该行提供上述错误:

0 投票
2 回答
2198 浏览

pdf - 从 PDF 文件中复制+粘贴希伯来语文本会导致最终字母被错误地复制

因此,我得到了一些希伯来语 PDF 文件,我想将其翻译成英文,当尝试将 PDF 文件中的文本复制并粘贴到文本编辑器中时,所有希伯来语最终字母都被错误地复制了。

我找到了这个问题,但没有找到解决方案,而且这个问题只是在谈论一个被错误阅读的特定最后一封信,它只是指一个特定的图书馆。

我尝试从 acrobat 阅读器和 chrome PDF 查看器中复制和粘贴,但都无法正确复制它们的内容。

我发现的另一个有趣的事情是,当您在浏览器中按 Ctrl+F(我在 chrome 上尝试过)并搜索最后一个字母“Pe”时,它会给出常规“Pe”和最后一个“Pe”的结果"(反之亦然,当您搜索常规“Pe”时),即使它们具有不同的代码点(以及 ANSI 代码页中的不同代码),这也很奇怪。(所有最后的字母和它们对应的常规字母都是一样的)

所以问题是 -有谁知道为什么会这样?
我知道可能没有映射到字形的实际代码点,但在这种情况下,字符是如何呈现的?我对这个主题不是很熟悉,所以我会很感激任何解释。此外,任何可以让我提取带有最终字母的文本的好的解决方案都将非常感激,因为我想解析文本并且弄乱了字母会导致单词不完整。

编辑:
根据 weibeld 的要求,我添加了一些复制的单词和相应的正确单词。我还将添加他们的 hexdump。

谢谢!

0 投票
1 回答
128 浏览

python - 如何在python中获取带有unicode字符的网页

我正在尝试获取并解析包含非 ASCII 字符的网页(网址为http://www.one.co.il)。这就是我所拥有的:

最后一行给了我一个例外:

我尝试查看其他相关问题,例如urllib2 read to UnicodeHow to handle response encoding from urllib.request.urlopen(),但没有发现任何有用的信息。

有人可以在这个主题上阐明并指导我吗?谢谢!