问题标签 [android-vision]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
android - 返回活动后 CameraSource 触发空异常
我有一个初始化条形码检测的活动。然后我去另一个活动,当我按下后退按钮时,它会触发这个异常的循环:
如果我坚持并再次进行其他活动,则会引发另一个异常:
CameraSource 在 onCreate 中是这样初始化的:
android - Android Face Detection API - Stored video file
I would like to perform face detection / tracking on a video file (e.g. an MP4 from the users gallery) using the Android Vision FaceDetector
API. I can see many examples on using the CameraSource class to perform face tracking on the stream coming directly from the camera (e.g. on the android-vision github), but nothing on video files.
I tried looking at the source code for CameraSource
through Android Studio, but it is obfuscated, and I couldn't see the original online. I image there are many commonalities between using the camera and using a file. Presumably I just play the video file on a Surface
, and then pass that to a pipeline.
Alternatively I can see that Frame.Builder
has functions setImageData
and setTimestampMillis
. If I was able to read in the video as ByteBuffer
, how would I pass that to the FaceDetector
API? I guess this question is similar, but no answers. Similarly, decode the video into Bitmap
frames and pass that to setBitmap
.
Ideally I don't want to render the video to the screen, and the processing should happen as fast as the FaceDetector
API is capable of.
android-vision - 在 TextRecognizer 中设置 OCR 白名单
我正在分析 ocr-reader 示例项目:https ://github.com/googlesamples/android-vision/tree/master/visionSamples/ocr-reader
目标是用 Android Vision 替换我为 Android(使用 OpenCV 和 Tesseract)定制的“文本到图像”实现。
我找不到任何方法为 OCR 处理器应用高级配置。例如,在我的应用程序中,只允许使用一组预定义的符号。为此,我在我的应用程序中使用以下代码:
例如,这有助于避免 0 和 O 之间的混淆。
有没有办法用 android-vision 做到这一点?在构建 TextRecognizer 时我没有看到任何选项:
总的来说,Google 是否计划扩展库的可配置性?例如:
- 源图像的裁剪
- 提供自定义 OCR 培训文件
或者它应该保持一个简单的库,只有共同的功能?
谢谢你的帮助!
android - 没有google账号如何安装条码扫描库?
我想在不允许登录 google 帐户的设备上安装 google play 服务的 android-vision 部分。传统上,通过 play store 下载 android-vision 库作为对 google play 服务的更新。
据此,包名应该是com.google.android.gms.vision.barcode。我使用 adb 列出了安装在我的根节点设备上的所有包,这些包已经下载了条形码扫描库,并且该包不在列表中。我希望自己拉包然后分发它。
感谢您的时间和精力。
android - Android Vision API:读取所有条形码,包括重复的
我们正在使用此代码读取包含 25 个条形码的文件的所有条形码。它返回其中的 23 个,因为其中有两个条形码重复。我们知道这个解决方案可以消除重复。是否有任何解决方案可以避免删除重复值?我们需要阅读所有这些,甚至是重复的。
android - Zbar vs zxing vs Google 条形码 api
我正在为二维码扫描器开发 android 应用程序,我尝试了 Google android 条码 API 和 zxing,但仍然困惑哪个更好用,我必须开发一个更多的应用程序来生成条码,除了 zxing 之外还有其他库吗几代二维码。一个应用程序将生成二维码,另一个应用程序将扫描它。如果我对这两个应用程序都使用 zxing 会更好吗?
java - 使用 android vision Text OCR 构建名片阅读器
我正在使用谷歌的 android 移动视觉 OCR 文本构建一个 android 应用程序,用于将名片作为手机中的联系人输入。
到目前为止,我已经能够识别任何拉丁生成文本,并且能够在代码块上应用正则表达式
我所做的是,我为五个变量名称、电子邮件、公司名称、网站、adrs、phnno 创建了一个联系人 bean 类在对生成的实时数据应用正则表达式后,我正在过滤结果并将它们保存在 bean 类型的对象中类并将该对象传递给活动并提取存储在该对象中的数据并将其显示在我的文本视图中。
OCR图形类检测方法>>>
Contacs Bean 可解析类
https://developers.google.com/android/reference/com/google/android/gms/vision/text/Text
https://codelabs.developers.google.com/codelabs/mobile-vision-ocr/#6
我已按照上述教程进行操作,我有以下问题
a-) 如何使用文本行而不是文本块?
b-) 我在 Graphic 类中使用 Timer Task 完成后如何杀死它还是应该使用其他方法?
c-) 有没有任何应用程序,我还没有找到一个使用视觉 OCR 进行名片输入的应用程序,但他们说它可以吗?
d-) 我的正则表达式 exp 在单独的 Java IDE 中经过正确测试有什么建议吗?
e-) 我正在使用额外的意图来获取存储在联系人 bean 对象中的数据并将其显示在活动中,它就像一个雪球永远不会停止,尽管我已经在我的IF STATEMENTS 中放置了标志。
f-) 在某个时候,我们可以阻止 OCR 库在所有标志都为真后检测任何进一步的文本。或者只是任何方式?
g-)无论条件为真与否,它都会不断覆盖我的变量?
所有的帮助都会受到高度重视。谢谢分配。
android - 如何使用 Google 的人脸 API 检测角/中心 X、Y 坐标?
大家好,我正在使用谷歌的新人脸 API(链接在这里),它与改进的 FaceDetection 一起使用。您得到的其中一件事是一个地标对象列表,每个对象都有一个 X 和 Y 坐标可供使用。
使用这些坐标,我试图找出图片的中心,但事实证明很难找出正确的数字。
到目前为止,这是我所知道的:
1)与旧方式不同,它不再是 1000、1000 乘 -1000、-1000
2)返回的坐标为浮点格式,为“...地标的(x,y)位置,其中(0, 0)是图像的左上角。该点保证为在图像的范围内。” (来源)
3)当我在日志中打印出这些坐标时,我得到的数字似乎与我的屏幕尺寸(1440w,2368h)不匹配。我打印出来的职位的一些例子是:
- 464.90558,1112.7573
- -19.159714,218.88104
- 28.383072,196.1712
- -130.06908,1071.8779
这是没有意义的,因为我不明白如果左上角是(0,0),坐标如何为负。
所以问题是,这些坐标是如何确定的?是否以某种方式与屏幕尺寸有关?他们是否正在以某种方式使用 DP 进行转换?他们有静电帽吗?
谢谢大家,
PGMac
android - 在 Android Mobile Vision 中使用管道检测文本时获取帧
我正在使用管道检测文本,就像Google CodeLabs 示例代码一样。如何获取 CameraSource 发送到 TextRecognizer 的预览帧?
android - 如何在移动视觉 API 文本检测中减小相机源的大小
由于 google vision api 文本检测预览全屏以扫描文本。我想要一个用于文本检测的小矩形并在文本框中显示下面识别的文本