我需要替换 Java 中字符串中的所有特殊控制字符。
我想问谷歌地图API v3,谷歌似乎不喜欢这些字符。
示例:http ://www.google.com/maps/api/geocode/json?sensor=false&address=NEW%20YORK%C2%8F
此 URL 包含此字符:http ://www.fileformat.info/info/unicode/char/008f/index.htm
所以我收到了一些数据,我需要对这些数据进行地理编码。我知道某些字符不会通过地理编码,但我不知道确切的列表。
我找不到有关此问题的任何文档,因此我认为 Google 不喜欢的字符列表是: http ://www.fileformat.info/info/unicode/category/Cc/list.htm
是否有任何已经构建的功能来摆脱这些字符,或者我必须构建一个新的,并一个一个替换?
还是有一个好的正则表达式来完成这项工作?
有人知道 Google 不喜欢哪些确切的字符列表吗?
编辑:谷歌为此创建了一个网页:
https://developers.google.com/maps/documentation/webservices/?hl=fr#BuildingURLs