0

我是 Video Intelligence API 的新手,但在我的项目中,我面临的挑战是获取视频源并通过视频智能 API 运行它,然后在每个场景变化时对其进行截图,并通过视觉 API 从这些截图中读取文本。有没有办法通过某种直播来做到这一点?谢谢!

4

2 回答 2

1

根据文档,实时流视频处理不可用。文档仅涵盖对本地或 GCS 中存储的 .MOV、.MPEG4、.MP4 和 .AVI 视频文件的支持。

让我提供一些可能对您有所帮助的信息。

Video Intelligence 列出了一组可用于视频分析的功能。其中之一是用于识别实体的标签检测,类似于 Vision API 所做的,但请记住,视频智能并不具备 Vision 所具有的所有功能。另一方面,我不认为你可以截图来阅读文本(没有那个功能),而是你只能检测镜头变化。标签检测示例:

curl -s -H 'Content-Type: application/json' \
    -H "Authorization: Bearer "$(gcloud auth application-default print-access-token) \
    'https://videointelligence.googleapis.com/v1/videos:annotate' \
    --data "{ \
   'inputUri':'gs://bucket-video/myvideo.mp4', \
   'features':['LABEL_DETECTION'] \
}"

不要忘记设置 GOOGLE_APPLICATION_CREDENTIALS=/JSON/CREDENTIALS/PATH

于 2018-10-15T19:01:32.680 回答
0

从 2020 年起,您可以使用 Google 视频智能 API 中的 Beta 功能来做到这一点:https ://cloud.google.com/video-intelligence/docs/streaming/live-streaming-overview

于 2020-09-10T18:42:43.997 回答