1

我正在尝试从 YouTube 的 Java API 获取视频的交互式脚本(如果可用),但这样做收效甚微,因为我找不到通过 API 获取它的方法。

因此,在使用 JSoup 获取页面后,我尝试使用 HTML 解析器解析页面(搜索 id = "transcript-scrollbox" 的元素),但这不起作用,因为页面不包含任何具有此 id 的元素。

Document doc = Jsoup.connect(pageUrl).get();

Element transcriptScrollBox = 

doc.select("div[transcript-scrollbox]").first();
//doc.getElementById("div#transcript-scrollbox");
if(transcriptScrollBox!=null)
  System.out.println("element in trnascript = " + transcriptScrollBox.text());

例如,在可汗学院关于概率的视频中,有一个按钮可以显示该视频的交互式脚本。我获取了此 URL 的页面内容,然后尝试搜索该元素。交互式脚本是否不是页面的一部分(可能是,因为元素 transcriptScrollBox 始终为空)。如果是,那么我该如何获取数据?

谁能指出我的方向或帮助我实现目标。

4

1 回答 1

0

我们不会通过 YouTube API 公开这些数据,我也不能提倡任何自动抓取 YouTube 网站的解决方案。很抱歉让您失望了。

于 2012-10-25T01:07:12.137 回答