1

我一直在使用 pgcrypto 扩展模块的摘要函数来编码几个值。我最近发现我尝试编码的一些 URL 值包含'%,'抛出一个

IndexError:元组索引超出范围。

我今天花了几个小时试图解决这个问题,但到目前为止我还没有在我的代码中纠正这个错误。如何对URL包含特殊字符的 a 进行编码?

这适用于pgAdmin4,但不适用于我的 python 脚本:

encode(digest('domainname.com/pub-cgi/retrieve.pl?doc=file%2F1999&zone_19=300%2A%20','sha256')

如何对包含特殊字符的 URL 进行编码?

4

1 回答 1

0

在对 Stack Overflow 进行了更多研究之后,我发现了一个多年前发布的解决方案。

解码 URL 中的转义字符

这是我用来解决编码问题的代码:

# This section of code reformats a href with URL encoding
def unquote(url):
   return re.compile('%([0-9a-fA-F]{2})',re.M).sub(lambda m: chr(int(m.group(1),16)), url)

# URL with encoding - https://www.somedomainname.com/pubs/retrieve.pl?doc=some%2Ddocument%2Dname.pdf

print (unquote('https://www.somedomainname.com/pubs/retrieve.pl?doc=some%2Ddocument%2Dname.pdf'))

# Output - https://www.somedomainname.com/pubs/retrieve.pl?doc=some-document-name.pdf

现在我已经重新格式化了这个 URL,我可以使用 pgcrypto 扩展模块的摘要函数使用 SHA-256 哈希进行编码。

encode(digest('https://www.somedomainname.com/pubs/retrieve.pl?doc=some-document-name.pdf','sha256')

特别注意:我在散列 URL 之前从 URL 中删除了 href 协议,因为它可以防止重复,这是我关心的问题。

于 2018-11-21T13:32:21.053 回答