7

我正在尝试从 Youtube 频道检索 Youtube 视频列表,例如“https://www.youtube.com/user/YouTube/videos”,以获取第 n 个视频(感谢key = "videoId")。直到几天前,当它开始征求我的同意时,它曾经像一个魅力一样工作。

我在 SO 上尝试了很多东西,但没有成功,我仍然看到要求我接受 cookie 以便观看视频的消息。

import requests
import re

url='https://www.youtube.com/user/YouTube/videos'
s1 = requests.session()
s1.get(url)
print("Original Cookies")
print(s1.cookies)
cookieValueNum = (re.findall(r'\d+', str(s1.cookies)))[0]
cookieValue = ('YES+cb.20210328-17-p0.en-GB+FX+'+str(cookieValueNum))
cookie = {'name': 'CONSENT', 'value': cookieValue, 'domain': '.youtube.com'}
print("==========")
print("After new Cookie added")
s1.cookies.update(cookie)
print(s1.cookies)
print(s1.get(url, cookies=cookie).text)

它仍然返回相同的消息,询问我是否同意 cookie(显然,在 html 中,这是我在私人会话中打开 Youtube 时得到的图片):

YT 同意书

然后我的想法是复制Consentcookie 并将其发送回以便能够访问页面内容。

知道我做错了什么吗?这个想法不是使用 Youtube API,而是在需要时仅请求/BeautifulSoup。

4

4 回答 4

7

您需要删除第一响应 cookie。我不确定如何在 requests.session 中执行此操作,但以下任何一项都对我有用。

requests.get('https://www.youtube.com/user/YouTube/videos', cookies={'CONSENT': 'PENDING+999'})

requests.get('https://www.youtube.com/user/YouTube/videos', cookies={'CONSENT': 'YES+cb.20210328-17-p0.en-GB+FX+{}'.format(random.randint(100, 999))})
于 2021-04-04T11:34:43.533 回答
2

我遇到了同样的问题 - 这是一个适合您的情况的解决方案。

使用 chrome 等浏览器,您始终可以检查需要传递哪些数据才能接受 cookie。您可以在开发工具 -> 应用程序 -> cookie 中找到这些信息。

谷歌浏览器 cookie 视图的屏幕截图

这样做,您会看到 youtube 需要 YES 或 NO 以及任何大于 0 的整数。

在您的请求中传递这些信息。就是这样。

requests.get('https://www.youtube.com/user/YouTube/videos', cookies={'CONSENT': 'YES+1'})
于 2021-07-02T09:42:36.013 回答
0

像这样设置您的请求的标题:

headers = {
        'Authorization': 'authorization',
        'cookie': 'hl=en'
    }

并使用 tor 更改所有请求的 ip。发送请求后检查您的响应,如果在您继续之前存在于 response.text 中,请设置时间休眠几秒钟(此时您的 ip 将更改)然后再次发送请求。

于 2021-11-23T08:09:33.543 回答
0

谷歌是一个骗子,并试图用这些技术来识别你。现在似乎有办法保留同意cookie - 或者你每次都必须给予同意

于 2021-04-04T06:22:53.677 回答