问题标签 [string-decoding]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
66 浏览

c# - 如何解码字符串中的“\/”

我正在解析一个经常包含/编码为\/. 例如,https://被编码为https:\/\/.

这种编码的名称是什么?它适用于在 HTML 中发送 json 时使用。这是一个很大的文档,/映射\/可能不是唯一使用的文档。解码它的c#函数是什么?

0 投票
2 回答
143 浏览

encoding - 了解在上下文中编码和解码以将字符串保存在磁盘上的需求

我已经在这里阅读了答案。我了解字节流是什么(1 和 0 的流),编码是(从该流到我们人类理解的字符的映射)和解码是(从字符到相应字节的反向映射)。

我仍然无法在脑海中调和整个概念。在 RAM 中,我们已经将所有内容都仅作为字节。而且我猜我的解释器本质上是在使用一些解码方案来向我展示与该字节流对应的字符。那么我们在保存到磁盘之前必须进行编码是什么意思呢?如果我的解释器使用“utf-8”向我们显示我正在输入的文本,并要求它使用“cp-1252”保存该文本,我是否更改了底层字节流?

0 投票
1 回答
8147 浏览

flutter - 未处理的异常:FormatException:意外的扩展字节(偏移量 5)

Json 响应有一个 gzip 编码的字符串。

我尝试了很多方法来解压缩字符串,但无法获得预期的结果。最后尝试的方法是

其中 zipText 是来自 json 的字符串,它会引发错误

另一种方式

抛出错误

非常感谢任何帮助。

0 投票
1 回答
29 浏览

python - 使用 Selenium 抓取文本后如何使用 Python 将替换字符转换为 UTF-8 字符

我使用此子例程从特定类子节点中获取文本

应用属性后转换后的字符串.text如下所示:

我将如何转换这些替换字符 (�),因为它们出现在原始 HTML 中。

在原始 HTML 中,替换字符表示为分数,特别是1/2

抱歉,如果这有点令人困惑,我是网络抓取和 HTML 的新手,所以如果需要更多说明,请告诉我,我会编辑问题!

0 投票
1 回答
885 浏览

algorithm - 给定一个仅包含 1 和 0 的字符串,返回大于 0 的子字符串的数量

假设 S 是一个只包含 0 和 1 的字符串。我想计算 S 的非空子字符串的数量,其中 0 的数量小于 1 的数量。

使用下面给出的蛮力方法,我们可以有一个算法在 O(n^2) 中解决这个问题:

但是我们能不能有一个更好的时间复杂度为 O(n*logn) 或 O(n) 的算法,并且空间复杂度是从 O(1) 到 O(n) 的任何值?

0 投票
0 回答
18 浏览

python-3.x - 保存解码的字节数据与打印

我有一个保存为二进制数据的 sql 脚本。我以标准方式阅读它。

当我打印 var_text 时,它显示为普通文本

但是当变量本身仍然是它的字节表示时,这意味着我不能在脚本上执行正则表达式。我需要能够以字符串表示形式保存文本,以便搜索模式。

我假设解码字节可以解决问题,但没有骰子。如何将对象保存为纯文本?

0 投票
1 回答
41 浏览

node.js - Gmail“完整”正文 base64url 编码意外输出

尝试使用官方 GoogleAPI 解码来自 Gmail 的消息时,在尝试从full消息获取请求中解码正文数据时遇到了意外问题。

用于检索的代码full

解码数据的值为:

<br />mail is sent as a courtesy from [redacted]. <br /> reply to: [redacted]. <br />sent on behalf of [redacted] <br /> <br />ation: [redacted] <br /> <br />ration Type: [redacted] <br />val Action: [redacted] <br /> <br /> <br />ID: [redacted] <br />

尽管raw使用以下代码使用请求检索电子邮件时:

解码数据的值是(特别关注正文,忽略需要进行的一些格式化/替换):

This email is sent as a courtesy from [redacted].=0D<br />=0APlease rep= ly to: [redacted].=0D<br />=0AEmail sent on behalf = of [redacted]=0D<br />=0A=0D<br />=0AApplication: [redacted]= =0D<br />=0A=0D<br />=0ARegistration Type: [redacted] =0D<br />=0A= Retrieval Action: [redacted] =0D<br />=0A=0D<b= r />=0A=0D<br />=0AGuest ID:[redacted]=0D<br />=0A=0D<br />

raw解码时的数据体与预期的实际数据一致,而full解码后的数据似乎缺少字符。

我尝试了下面列出的几个库,但仍然无法解决缺少字符的问题:

  • base64url
  • js-base64
  • urlsafe-base64

我也尝试过直接从代码片段base64urlBuffer.from方法中解码full以放弃替换,但仍然无济于事。

我已经在以下平台上测试了这段代码,并且都产生了相同的结果,所以我不认为它与系统相关:

  • Windows 10 20H2 - 节点 16
  • MacOS 12.0.1 - 节点 17
  • CentOS 8 - 节点 17
  • Ubuntu 20.04 - 节点 17
  • Node-17-alpine Docker 容器

这似乎也与输出变量无关,因为我使用 express 输出到 Web 浏览器,直接输出到控制台,甚至输出到文件;所有三个产生相同的输出。

在这一点上,我不知道还有什么可以尝试的。

编辑跟进:按照建议从full片段中删除replace()s,直接进入base64,甚至base64url解码后,我仍然遇到同样的问题;甚至贯穿上述所有系统。

0 投票
0 回答
15 浏览

qr-code - 解码 QR 图像

我有那个 Qr 图片

这是一个阿兹特克代码类型

我使用了https://zxing.org/然后结果是这样的

BCD0B620100000000000000000000000000000000009AB10B620000303C021C673883D2336C9C07154E7ABCAA9BF45B575E16305BD956272A1BEB5F021C6DF19DA0AD2B812FFC308

我怎样才能看到隐藏在那里的真实信息?问候。

0 投票
1 回答
19 浏览

python - 逆向工程“UTF-8 Like”编码算法

我正在尝试对编码算法进行逆向工程,以确保与其他软件包的向后兼容性。对于要在输出文件中编码的每种类型的数量,都有一个单独的编码过程。

给定的文档仅向最终用户展示了如何解析编码文件中的值,而不是向其中写回任何内容。但是,我已经能够为除以下文件类型之外的每种文件类型成功创建一个write_int()对应read_int()文件read_string()

我目前(并且已经有一段时间)努力弄清楚read_string()下面列出的函数中到底发生了什么。

我完全理解这是一个掩码问题,并且第一个操作while partial_length & 0x80 > 0:是一个简单的按位掩码,它要求我们仅在检查大于 128 的值时才进入循环,当我试图从该while语句内的循环。我得到了操作背后的数学机制,但我不明白为什么他们会以这种方式做事。

我已经包含了read_byte()上下文函数,因为它在read_string()函数中被调用。

这是否表明由于信息丢失而无法完成任务,还是我错过了执行与此read_string功能相反的明显方法?

我将非常感谢任何可能的信息、见解(无论您认为它们多么明显)、帮助或指针,即使这只是指向您认为可能有用的页面的链接。

干杯!