现在我正在研究维基百科。在许多文章中,我注意到一些 URL,例如https://www.google.com/search?q=%26%E0%B8%89%E0%B8%B1%E0%B8%99很长. 示例 URL 可以替换为更短更简洁的“https://www.google.com/search?q=%26ฉัน”(ฉัน 是泰语单词)。但是,当我使用 urllib.unquote 函数解码 URL 时,它甚至会解码 %26 并得到“https://www.google.com/search?q=&ฉัน”作为结果。您可能已经注意到,这个 URL 是无用的;它没有建立有效的链接。
因此,我想知道如何在有效的情况下获取解码链接。我认为只解码非 ascii 字符会得到有效的 URL。这是正确的吗?以及如何做到这一点?
谢谢 :)