0

我正在尝试抓取 YouTube 频道 ID(例如 UCqwbZ-xTkn_EmyIhSvZRRWQ)并使用 IMPORTXML 公式将其导入 Google 表格,但没有运气。频道 ID 可以在频道的页面源中找到 ( https://www.youtube.com/channel/UCqwbZ-xTkn_EmyIhSvZRRWQ )

任何人都可以就如何解决这个问题提供一些指导吗?

在 Google 工作表中,我有一个 YouTube 频道 URL 列表,并且想要抓取这些 ID。

我已经通过抓取订阅者来管理它,只是频道 ID 没有运气。

任何帮助将不胜感激。

4

3 回答 3

0

在你的情况下,你不需要从 YouTube 上抓取它。尝试:

=REGEXEXTRACT(A2, "channel/(.+)")

0

于 2019-03-12T14:47:44.340 回答
0

我无法使用@player0建议的公式得到结果,因此,经过大量研究,绞尽脑汁并花费数小时,我终于找到了一个可行的解决方案。@player0 的公式包含一个没有意义的正则表达式,即“ <meta itemprop=channelId content=|>”,而不是我将 REGEXEXTRACT 与 Regex 一起使用"UC[0-9A-Za-z_-]{21 }[AQgw]",因此公式:=INDEX(ARRAYFORMULA(REGEXEXTRACT(QUERY(SUBSTITUTE(ARRAY_CONSTRAIN(IMPORTDATA(A40); 3000; 1);"""";"");"where Col1 contains '<meta itemprop=channelId content='");"UC[0-9A-Za-z_-]{21}[AQgw]"));1;1)ID 做 YouTube

于 2021-10-09T13:02:41.170 回答
0
=ARRAYFORMULA(REGEXREPLACE(QUERY(SUBSTITUTE(ARRAY_CONSTRAIN(
 IMPORTDATA(A40), 3000, 1), """", ""),
 "where Col1 contains '<meta itemprop=channelId content='"),
 "<meta itemprop=channelId content=|>", ""))

0

于 2019-03-11T16:23:53.870 回答