0

您好,在 Python 中运行以下脚本时出现以下错误:

import requests

r = requests.get('https://www.instagram.com/p/CJDxE7Yp5Oj/?__a=1')
data = r.json()['graphql']['shortcode_media']

C:\ProgramData\Anaconda3\envs\test\python.exe C:/Users/Solba/PycharmProjects/test/main.py
Traceback(最近一次调用最后):
文件“C:/Users/Solba/PycharmProjects/test/main .py”,第 4 行,在
data = r.json()
文件“C:\ProgramData\Anaconda3\envs\test\lib\site-packages\requests\models.py”,第 900 行,在 json 中
返回 complexjson.loads (self.text, **kwargs)
文件“C:\ProgramData\Anaconda3\envs\test\lib\json_ init _.py”,第 357 行,加载
返回 _default_decoder.decode(s)
文件“C:\ProgramData\ Anaconda3\envs\test\lib\json\decoder.py”,第 337 行,在解码
obj 中,end = self.raw_decode(s, idx=_w(s, 0).end())
文件“C:\ProgramData\ Anaconda3\envs\test\lib\json\decoder.py",第 355 行,在 raw_decode
提高 JSONDecodeError("Expecting value", s, err.value) from None
json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)

进程以退出代码 1 结束


Python 版本:3.9
PyCharm 版本:2020.3.1
Anaconda 版本:1.10.0


请帮忙。感谢你。

4

2 回答 2

1

r.json()期望 API 返回一个 JSON 字符串。API 应该明确表示它正在通过响应标头使用 JSON 进行响应。

在这种情况下,您请求的 URL 要么未使用正确的 JSON 响应,要么未明确表示它使用 JSON 响应。

您可以首先通过以下方式检查 URL 发送的响应:

data = r.text
print(data)

如果响应可以被视为 JSON 字符串,那么您可以使用以下方法对其进行处理:

import json
data = json.loads(r.text)

注意:您还可以检查content-typeAccept标头以确保请求和响应在所需的数据类型中

于 2020-12-21T17:10:33.293 回答
0

原因是响应没有返回 JSON,而是返回整个 HTML 页面。尝试r.text代替r.json()...,然后从那里做任何你想做的事情。

如果您不确定它返回的内容类型:

h = requests.head('https://www.instagram.com/p/CJDxE7Yp5Oj/?__a=1')
header = h.headers
contentType = header.get('content-type')
print(contentType)

根据您的 URL,它返回text/html.

或者,您可以尝试User-Agent在您的请求中添加一个 - 这是为了模拟请求,使其看起来像是来自浏览器,而不是脚本。

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) Chrome/46.0.2490.80'
}

r = requests.get('https://www.instagram.com/p/CJDxE7Yp5Oj/?__a=1', headers=headers)
data = r.json()
于 2020-12-21T16:55:27.770 回答