google-cloud-platform - 视频情报直播

Question

我是 Video Intelligence API 的新手，但在我的项目中，我面临的挑战是获取视频源并通过视频智能 API 运行它，然后在每个场景变化时对其进行截图，并通过视觉 API 从这些截图中读取文本。有没有办法通过某种直播来做到这一点？谢谢！

score 1 · Accepted Answer

根据文档，实时流视频处理不可用。文档仅涵盖对本地或 GCS 中存储的 .MOV、.MPEG4、.MP4 和 .AVI 视频文件的支持。

让我提供一些可能对您有所帮助的信息。

Video Intelligence 列出了一组可用于视频分析的功能。其中之一是用于识别实体的标签检测，类似于 Vision API 所做的，但请记住，视频智能并不具备 Vision 所具有的所有功能。另一方面，我不认为你可以截图来阅读文本（没有那个功能），而是你只能检测镜头变化。标签检测示例：

curl -s -H 'Content-Type: application/json' \
    -H "Authorization: Bearer "$(gcloud auth application-default print-access-token) \
    'https://videointelligence.googleapis.com/v1/videos:annotate' \
    --data "{ \
   'inputUri':'gs://bucket-video/myvideo.mp4', \
   'features':['LABEL_DETECTION'] \
}"

不要忘记设置 GOOGLE_APPLICATION_CREDENTIALS=/JSON/CREDENTIALS/PATH

score 0 · Accepted Answer

从 2020 年起，您可以使用 Google 视频智能 API 中的 Beta 功能来做到这一点：https ://cloud.google.com/video-intelligence/docs/streaming/live-streaming-overview

google-cloud-platform - 视频情报直播

2 回答 2

Related

Reference