我正在尝试制作可以读取网页的内容,然后从那里获取内容并在网页内搜索内容,然后仅复制它。我不知道如何让它只复制我想要的这么多字符串。更难的是,网页上没有任何 CSS,只是文本。
对于我想使用正在阅读的代码的事情是
"Token":"5acd163ee08b41b801e0863889111e334b5dd8c2e4f0","ID":4,"
我希望输出只是:
5acd163ee08b41b801e0863889111e334b5dd8c2e4f0
我正在尝试制作可以读取网页的内容,然后从那里获取内容并在网页内搜索内容,然后仅复制它。我不知道如何让它只复制我想要的这么多字符串。更难的是,网页上没有任何 CSS,只是文本。
对于我想使用正在阅读的代码的事情是
"Token":"5acd163ee08b41b801e0863889111e334b5dd8c2e4f0","ID":4,"
我希望输出只是:
5acd163ee08b41b801e0863889111e334b5dd8c2e4f0
此正则表达式将返回 Token 值,如果格式始终不变并且只有上面表达式中的值发生变化:
text = '"Token":"5acd163ee08b41b801e0863889111e334b5dd8c2e4f0","ID":4," '
m = re.search(r'"Token":"([\w]+)"', text)
m.groups()[0]
>>> '5acd163ee08b41b801e0863889111e334b5dd8c2e4f0'
非正则表达式方式,使用优秀的requests
库:
import requests
g = requests.get('http://www.example.com/some-file.txt')
print(g.text.split(',')[0].split(':')[1])