我有一个奇怪的问题。
我有一个抓取网页以获取名称列表的应用程序。然后将该列表传递给使用这些名称的另一个应用程序,使用其 API 向站点请求信息。
当我将第一个网页中的某些字符串与 API 抓取的其他字符串进行比较时,通常会得到错误的结果。
我试图逐个字母地获取字符值我得到了这个:
Rocco De Nicola
82 111 99 99 111 160 68 101 32 78 105 99 111 108 97 1st web page
82 111 99 99 111 32 68 101 32 78 105 99 111 108 97 2nd
如您所见,在第一个字符串中,空格被编码为 160(不间断空格)而不是 32。
我可以正确编码第一组字符串吗?
我也尝试将 Charset 设置为 UTF-8,但没有成功。
也许我只需要将 160 替换为 32 ?