我应该如何格式化带有特殊/国际字符的 URL?
目前,我尝试使 URL “看起来不错”,以便:
www.myhost.com/this is a test, do you know how?
转换为:
www.myhost.com/this_is_a_test_do_you_know_how
我知道可以转换一些国际字母(ü = ue,æ = ae,å = aa),可以删除一些字符。我一般会尝试使 URL 看起来“不错”,但这很愚蠢吗?
但是,与我们的西方 ASCII 格式无关的中文、日文、阿拉伯字母怎么办?
我真的不喜欢用十六进制代码重写 URL 的想法,所以现在如果 url 包含太多“不可转换”字符,我只使用我的内部唯一 ID。