我在我的 android 应用程序中集成了 firebase MLKit。我正在使用设备上的 TextRecognizer API 来检测实时摄像机源上的文本。它检测到文本,但处理图像需要很长时间(从 300 毫秒到 1000 毫秒)。由于延迟较大,叠加层不像 Google 镜头应用程序那样平滑。
我该怎么做才能使检测到的文本覆盖在帧之间获得平滑过渡,从而以更大的延迟进行处理?
另外,我注意到谷歌镜头应用程序将文本检测为一个完整的句子,而不是显示文本块。谷歌镜头应用程序如何将文本检测为句子/段落?