问题标签 [text-decoding]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
469 浏览

c# - 文本解码问题

所以给定这个输入字符串:

而这个功能:

结果与从输入字符串中提取的数据相同。我做错了什么,这个文本没有被正确解码?

更新

所以我有这个解码报价打印的代码:

这只是留下了下划线。我是否手动将它们转换为空格(替换(“_”,“)),还是我需要做其他事情来处理它?

0 投票
3 回答
2067 浏览

c++ - boost::iostreams::zlib::default_noheader 似乎被忽略了

我无法让 boost::iostreams 的 zlib 过滤器忽略 gzip 标头...似乎将 zlib_param 的 default_noheader 设置为 true 然后调用 zlib_decompressor() 会产生“data_error”错误(标头检查不正确)。这告诉我 zlib 仍然期待找到标头。有没有人得到 boost::iostreams::zlib 来解压缩没有标题的数据?我需要能够读取和解压缩没有两字节标头的文件/流。任何帮助将不胜感激。

这是 boost::iostreams::zlib 文档提供的示例程序的修改版本:

我知道我的测试数据还不错;我写了一个小程序在测试文件上调用gzread();它已成功解压缩......所以我很困惑为什么这不起作用。

提前致谢。

-冰

0 投票
1 回答
1467 浏览

xml - 如何从 nvprof 或 NVidia Visual Profiler 的输出中获取计时值?

我正在使用 nvprof 来分析某些东西(包括 CPU 工作和 GPU 工作,即我使用 nvprof 标记等),并且我得到了 nvprof 生成的二进制文件。我可以将这些导入到 NVVP(NVidia Visual Profiler;Linux 版本)中,并且稍加努力也可以将其保存到 XML 中。

但是... XML 不包含有关我的各种 CPU 何时执行的计时数据。它提到了他们的存在,但没有更多。此外,XML 的末尾有这个二进制 blob,可能是 Base64 编码或其他东西,位于 PDM 标记内。我不清楚那里是否有任何帮助。

0 投票
0 回答
1064 浏览

java - java net URLDecoder decode 解码不起作用

我首先尝试通过应用以下脚本来获取网页中的所有链接:然后我想再次使用这些链接。但由于解码并不总是有效,这会导致链接不正确,并且我收到 404 错误。

在此代码中,解码部分似乎适用于某些 url。我得到的样品如下:

正如所见,第一个链接解码不起作用,而后来它起作用了。

我错过了什么?如上面的代码所示,我还尝试了 parseBase64Binary 和 printBase64Binary ,但它再次不起作用。

提前致谢!

0 投票
2 回答
303 浏览

unix - 使用 VT100 转义序列嵌套文本装饰

有没有办法嵌套 VT100 转义序列?例如,如果我想在红色文本中使用粗体字,如下所示:

在此处输入图像描述

有没有简单的方法来做到这一点?如果我执行以下操作,第一个\e[m打算关闭粗体的脸也会关闭红色。

0 投票
1 回答
8503 浏览

java - base64 解码为 UTF-8,一个字符显示不正确

我正在尝试将字符串从 base64 解码为 UTF-8 以进行分配。

有一段时间没有编写 Java 了,我可能没有使用最有效的方法,但是我设法实现了一个 99% 正确工作的函数。

Decoding the example string in Base64: VGhpcyBpcyBhbiBBcnhhbiBzYW1wbGUgc3RyaW5nIHRoYXQgc2hvdWxkIGJlIGVhc2lseSBkZWNvZGVkIGZyb20gYmFzZTY0LiAgSXQgaW5jbHVkZXMgYSBudW1iZXIgb2YgVVRGOCBjaGFyYWN0ZXJzIHN1Y2ggYXMgdGhlIPEsIOksIOgsIOcgYW5kICYjOTYwOyBjaGFyYWN0ZXJzLg==

结果: 这是一个 Arxan 示例字符串,应该很容易从 base64 解码。它包括许多 UTF8 字符,例如 ñ、é、è、ç 和 π 字符。

但是,在 π 的位置应该是输出的 π 符号。

请注意,我删除了 ; 在这里 π 之后,似乎 Stackoverflow 自动将其更正为 π

我已经尝试了很多事情,例如创建一个字节数组并打印它,但仍然无法正常工作。

我正在使用 Eclipse,是否只是那里的输出显示不正确?

有人建议让它工作吗?

谢谢,文森特

这是我的代码:

0 投票
1 回答
3089 浏览

java - 使用 Apache Tika 从文本/PDF 中删除特殊字符

我正在解析 PDF 文件以使用 Apache Tika 提取文本。

上面的代码有效,PDF 中的文本被提取。

PDF 文件中有一些特殊字符(如@/&/£ 或商标符号等)。如何在提取过程中或提取后删除这些特殊字符?

0 投票
2 回答
39 浏览

ios - 编码问题。转换为可识别字符串

我的项目中有一个小问题。

我用“Paris 11'e8me”这样的字符串获取 JSON,我希望它显示为“Paris 11ème”。

我的猜测是该字符串是用 isoLatin1 之类的东西编码的。我希望它正确显示(utf8?)

我该如何转换它?提前致谢

0 投票
2 回答
492 浏览

python - 使用 Python 进行 utf-8 解码

我有一个带有一些数据的 csv,并且在一行中有一个文本是在将其编码为 utf-8 后添加的。

这是文本:

我正在尝试使用此文本使用解码功能获取原始字符,但这是不可能的。

有谁知道这样做的正确程序是什么?

0 投票
0 回答
289 浏览

javascript - TextDecoder 解码 Uint8Array 的问题

TextDecoder 解码 Uint8Array 时出现问题。(背景资料

应该给我:hello\xFF\x00

而是给了我:hello\xFD\x00

难道我做错了什么?