问题标签 [string-decoding]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
171 浏览

java - 如何在java中解码未知的字符串格式

我正在获取需要在 SpringBoot Rest 控制器中处理的 xml 文件。但我在解析西里尔字符时遇到问题。在我的控制器中,这些符号如下所示:d�鲲㮮弯。

我试图使用解码

我也试图添加到我的控制器:

我的控制器顶部如下所示:

我需要将其解析为标准西里尔文形状。谢谢你。

0 投票
1 回答
743 浏览

java - 如何在java中将字符串转换为二进制utf-16和二进制到字符串?

我的项目需要将阿拉伯语文本转换为二进制,然后将二进制转换为文本(反向过程)。我使用了这段代码,但我注意到当我使用 utf-16 将字符串转换为二进制时,然后读取此二进制以将其转换回原始 UTF-16 字符串会给我不同的字符

例如:编码中使用的阿拉伯字符是 (ن),它通过 utf-16lE 转换为二进制 (0100011000000110)

现在,当我想将这些二进制位(0100011000000110)转换为原始 utf-16 字符串时,会给我不同的字符是 F。

如果字符串是阿拉伯字符和 utf-16 编码,就会出现这些问题。我该如何解决这个问题..?

0 投票
1 回答
1594 浏览

java - Base64 编码/解码不适用于 Java 1.6 中的特殊字符

我正在使用 JDK 1.6 并在尝试编码/解码法语单词时遇到问题。我的代码在:

结果是: Original String Vos factures impayées Internet sont

编码字符串:Vm9zIGZhY3R1cmVzIGltcGF577+9ZXMgSW50ZXJuZXQgc29udA==

解码:Vos factures impay�es Internet sont

问题:在解码字符串时,我得到“�”特殊字符而不是“é”

0 投票
2 回答
1858 浏览

java - Defining Empty String in Avro Schema

I currently having an issue with the Avro JsonDecoder. Avro is used in Version 1.8.2. The .avsc file is defined like:

When I now run my test cases I get an org.apache.avro.AvroTypeException: Expected string. Got END_OBJECT. The class throwing the error is JasonDecoder. For me it looks like the defaut value handling on my side might not be correct with using just "" as the default value. The error occurs only if the field is not available at all, but this, in my understanding, is the case when the default value should be used. If I set the value in the json as "CodeNumber": "" the decoder does not have any issues. Any hints or ideas?

0 投票
1 回答
337 浏览

java - 在 Java 中将十六进制字节数组的字符串表示形式转换为具有非 ascii 字符的字符串

我有一个字符串由客户端在请求有效负载中发送为:

我想得到一个字符串"áéíóúÁÉÍÓÚDepartms"。我怎样才能在 Java 中做到这一点?

问题是我无法控制客户端编码此字符串的方式。似乎客户端只是以这种格式编码非 ascii 字符并按原样发送 ascii 字符(请参阅最后的“Departms”)。

0 投票
1 回答
654 浏览

python - print (encoding/edcoding) 法语字符在 txt 文件中有效,但在 excel/csv [python] 中不正确

我得到了一个带有特殊字符(应该是法语字符)的字符串,并希望它在 csv/excel 中正确显示:

结果 txt 文件正确显示法语,但 csv 不正确。

在此处输入图像描述

我的问题是如何让 csv 正确显示?(我可以将法语字符从 txt 复制到 csv,但是如何以编程方式编写 csv 并正确显示?)


更新:感谢@snakecharmerb,我试过了encoding = 'utf-8-sig'

在此处输入图像描述

0 投票
1 回答
304 浏览

python-3.x - pytesseract 难以阅读文本

我需要读取热像图上的最高温度,如下图:

IR_1544_INFRA.jpg

IR_1546_INFRA.jpg

IR_1560_INFRA.jpg

IR_1564_INFRA.jpg

我使用了以下代码,这是最好的结果。我还尝试了其他几种方法,例如:模糊、灰度、二值化等,但都失败了。

在第一张图片中,我发现 了这个

在第二张图片中,我发现了这个

imagem 布局始终相同,即温度始终在同一个位置,因此我裁剪图像以仅隔离数字。我想要(这里是 97.7 这里是 85.2 )。

我的代码需要从这些图像中查找以始终检测此温度并生成一个从最高到最低指示的列表。

在这些图像的情况下,你对我有什么建议来提高 pytesseract 的自信?

注意 1:当我分析整个图像(不裁剪)时,它返回的数据甚至不存在。

注意 2:在某些图像中,即使是二进制数,pytesseract (image_to_string) 也不会返回任何数据。

谢谢大家,对错别字感到抱歉,用英语写作对我来说仍然是一个挑战。

0 投票
2 回答
255 浏览

python - 转换熊猫数据框中所有非显示字符的最佳方法是什么?

我正在将数据dataframe从 Excel 工作表加载到 pandas 中,并且我想转换的许多列中有很多非显示字符。

最普遍的是在收缩中使用撇号;例如doesn't,结果为doesn’t.

过去我使用过:

但这需要我知道我需要修复哪些列。

在这种情况下,我有 103 列,每列都可能包含此类问题或其他类型的问题。

我正在寻找一种方法来替换整个dataframe.

有没有一种快速简便的方法可以在整个过程中执行此操作,dataframe而无需将每一列传递给函数?

0 投票
1 回答
34 浏览

javascript - 节点js中的解码问题

我有一个要求,我需要在“iso-8859-1”中编码数据,然后将其转换回节点 js 中的可读字符串。

在 .Net 环境中:

结果=timesereis

类似的,我需要在node js中编码和解码

在 Node js 中(使用 iconvlite)

结果,我得到 “VABpAG0AZQAgAHMAZQByAGUAaQBzAA==” 而不是解码结果

0 投票
2 回答
3354 浏览

python-3.x - 将图像字节数据流解码为 JPEG

我正在努力成功地从字节解码 JPEG 图像,然后再次返回 JPEG。

我从 MJPG 字节流中的编码帧开始,我想对其进行解码以便使用 OpenCV 进行操作。我是 Python、numpy、opencv 等的新手!

我现在将文本文件中的帧 JPG 数据保存为: b'\xf\xd8\xff\xdb\x00..etc 等用于测试目的:

当我尝试在第 14 行将 numpy 数组的大小调整为原始视频流分辨率(640、480)时,代码似乎失败了(npFlat.reshape((640,480))

**ValueError:无法将大小为 228140 的数组重新整形为 (640,480)*

是不是即使我的视频帧是从 640、480 馈送中捕获的,但由于某种原因,在编码过程中大小发生了变化?这就是我目前所能想到的。欢迎任何/所有帮助。

我已经查看了一篇相关文章:Python - byte image to NumPy array using OpenCV but trying to avoid PIL,并且 frombuffer 方法对我来说似乎也失败了。

好的,所以我取得了一些进展,现在有:

当我将 npFlat 重塑为 (374, 610) 时,我现在也可以让代码成功。也就是说,374 x 610 = 长度为 228140 的平面 numpy 数组……但这一切似乎都很奇怪。缓冲区信息代表我正在尝试重新打开的 JPG……但还没有接近。

MyBytes.txt" 数据输入文件可在此处查看: https://drive.google.com/file/d/18pqILl9myeTRjdiqtExFyOe94Km_aNNM/view?usp=sharing] 1