问题标签 [google-vision]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
android - android vision face not found 耳朵
我遵循了 Google 的官方教程: https ://developers.google.com/vision/android/face-tracker-tutorial 但问题是我的应用找不到任何耳塞或耳塞。
最多只能找到8个标记,分别是左眼、右眼、鼻根、左脸颊、右脸颊、左嘴、右嘴、下嘴。
我尝试使用 .setLandmarkType(FaceDetector.ALL_LANDMARKS) 和 .setMode(FaceDetector.ACCURATE_MODE) 但仍然无法正常工作。
我不确定它是否只是我的设备。我的测试设备是三星 Galaxy S5。
java - 如何在 Android 视觉 CameraSource 中添加放大/缩小手势
我正在尝试开发一个带有面部检测功能的简单相机应用程序,并且我正在使用来自这里的 android-vision 示例 https://github.com/googlesamples/android-vision/tree/master/visionSamples/FaceTracker
一切正常,我需要在其中添加放大/缩小功能。我搜索了 SO,但没有发现任何与视力有关的东西。每个答案都与 Camera2 有关。
android - 从字符串 rawValue 结果生成 com.google.android.gms.vision.barcode.Barcode
我正在使用谷歌视觉进行条码扫描。我想保留每个扫描结果的历史记录,因此我将“格式”、“原始值”存储到 sqlite 数据库中。因此,当我想再次显示历史记录项时,我想将此“rawValue”转换为“com.google.android.gms.vision.barcode.Barcode”对象,以便直接获取值。
那么有什么办法吗?我们在哪里传递 'rawValue' 并获得 'com.google.android.gms.vision.barcode.Barcode' 对象?
如果有人知道,请帮助我,因为我找不到任何提示或示例。
android - Google Vision api 从位图中提取文本
我正在尝试开发一个从屏幕截图中提取文本的应用程序,并使用这些数据(数字和文本)做一些事情。它有效,但不像我预期的那样,它根本不准确。奇怪的是,我的应用程序和google vision api 网站上的“try api”以不同的方式识别相同分辨率的相同屏幕截图
例如:我的应用程序将带有“410”作为文本的屏幕截图识别为“A10”。否则 google api 站点正确识别 410
我注意到 google Keep OCR 比我的应用更好,它使用相同的 api?作为 google Keep 或 google vison api 站点,我可以做些什么来改善我的应用程序中的文本识别?
这是我的代码:
ocr类
安卓清单
摇篮
google-app-engine - 我可以在不激活免费试用版的情况下使用 Google Cloud Vision API 吗?
有没有办法在不激活我的免费试用版的情况下在应用程序中测试 Google Vision API?
我正在尝试在示例测试应用程序中使用 API,但如果没有添加有效的计费方法,我将无法启用 Vision API。
错误消息:“API 需要有效的计费方式。”
当我尝试从仪表板启用计费时 - 计费 - 它重定向到一个页面,我必须在该页面输入我的信息才能“免费试用 Cloud Platform”,并且我必须单击带有消息的按钮 - “开始我的免费审判”。有没有办法在不开始免费试用的情况下启用计费?
我只想使用免费套餐(我是否必须放入信用卡都没关系),而不会“浪费”我的免费试用版——我认为这么多试用版的钱可以花在其他地方更好......
image-processing - 来自边界框的 Google Vision Api 文本检测布局信息
我正在尝试使用 google vision api 对我的图像执行 OCR。API 调用的 Json 输出返回带有边界框信息的已识别单词。
有人可以告诉我如何使用这个边界框信息对我的图像进行布局分析吗?
如果有一个库将其作为输入并返回句子而不是单词?
例如,在上面的 json 中,“Ingredients:”“Chicken”这两个词在同一行。是否有图书馆可以开箱即用地为我提供这些信息?
用于 OCR源图像的图像
android - CameraSource.stop() 是否需要从 UI 线程调用?
我正在开发一个使用 Mobile Vision 的 Google Barcode Scanner API 的 android 应用程序。应用程序的目的是检测条形码,然后根据与条形码相关的数据采取一些行动。
一旦检测到第一个条形码,我想停止摄像头源,这样检测就不会继续。当我尝试在回调cameraSource.stop()
内部执行receiveDetections(Detector.Detections<Barcode> detections)
时,线程被阻塞并且 logcat 中有很多日志输出。由于此回调不在 UI 线程中执行,因此 UI 保持畅通。我尝试cameraSource.stop()
在 UI 线程中执行,它工作正常。
我尝试过从cameraSource.start()
UI 线程和另一个线程调用,并且都可以正常工作。
现在我在文档中的任何地方都找不到与 cameraSource 的交互应该来自 UI 线程或工作线程的任何地方。我无法弄清楚为什么从另一个线程调用它会失败的逻辑。
android - 在 Android 谷歌视觉 OCR 中我如何确定识别的准确性
在 google vision OCR 中,在 Android 下,我如何找到并知道识别文本的准确性是多少?
google-api - google vision api 可以从图像中识别代码文本(例如 javascript)吗?
OCR 能否识别等号、大括号“{}”和圆括号等字符?准确吗?