0

我正在开发一个使用 requests_html 模块的刮板。我制作了一个程序,该程序应该从我的站点获取一些用户名,但是它将空格作为问号返回。

这是我的代码:

self.session = AsyncHTMLSession()
self.users= []

resp = await self.session.get(self.overall)

for a in resp.html.find('a'):
    if "user" in str(a):
        user_array = str(a).split("=")
        username = account_array[2].replace("'>", "")
        self.users.append(username)

print(self.users)
4

1 回答 1

0

通过用空格替换 unicode 字符来修复它。

if u"\uFFFD" in username:
    username = username.replace(u"\uFFFD", " ")
    print(username)
于 2019-12-16T14:59:08.393 回答