3

我正在使用带有 Firebase MLKit 条形码阅读器的 CameraX 来检测条形码。应用 识别条码没有问题。但我正在尝试添加边界框,以实时显示 CameraX 预览中的条形码区域。边界框信息从条形码检测器功能中检索。但它没有正确的位置和大小,如下所示。

在此处输入图像描述

这是我的活动布局。

<?xml version="1.0" encoding="utf-8"?>
<androidx.constraintlayout.widget.ConstraintLayout
    xmlns:android="http://schemas.android.com/apk/res/android"
    xmlns:app="http://schemas.android.com/apk/res-auto"
    xmlns:tools="http://schemas.android.com/tools"
    android:layout_width="match_parent"
    android:layout_height="match_parent"
    tools:context=".MainActivity">

    <Button
        android:id="@+id/camera_capture_button"
        android:layout_width="100dp"
        android:layout_height="100dp"
        android:layout_marginBottom="50dp"
        android:scaleType="fitCenter"
        android:text="Take Photo"
        app:layout_constraintLeft_toLeftOf="parent"
        app:layout_constraintRight_toRightOf="parent"
        app:layout_constraintBottom_toBottomOf="parent"
        android:elevation="2dp" />

    <SurfaceView
        android:id="@+id/overlayView"
        android:layout_width="match_parent"
        android:layout_height="match_parent" />

    <androidx.camera.view.PreviewView
        android:id="@+id/previewView"
        android:layout_width="match_parent"
        android:layout_height="match_parent" />

</androidx.constraintlayout.widget.ConstraintLayout>

SurfaceView用于绘制此矩形形状。

条码检测发生在BarcodeAnalyzer实现ImageAnalysis.Analyzer. 在覆盖analyze函数中,我检索如下条码数据。

@SuppressLint("UnsafeExperimentalUsageError")
    override fun analyze(imageProxy: ImageProxy) {

        val mediaImage = imageProxy.image

        val rotationDegrees = degreesToFirebaseRotation(imageProxy.imageInfo.rotationDegrees)

        if (mediaImage != null) {

            val analyzedImageHeight = mediaImage.height
            val analyzedImageWidth = mediaImage.width

            val image = FirebaseVisionImage
                .fromMediaImage(mediaImage,rotationDegrees)

            detector.detectInImage(image)
                .addOnSuccessListener { barcodes ->

                    for (barcode in barcodes) {
                        val bounds = barcode.boundingBox
                        val corners = barcode.cornerPoints
                        val rawValue = barcode.rawValue

                        if(::barcodeDetectListener.isInitialized && rawValue != null && bounds != null){
                            barcodeDetectListener.onBarcodeDetect(
                                rawValue,
                                bounds,
                                analyzedImageWidth,
                                analyzedImageHeight
                            )
                        }
                    }

                    imageProxy.close()

                }
                .addOnFailureListener {
                    Log.e(tag,"Barcode Reading Exception: ${it.localizedMessage}")
                    imageProxy.close()
                }
                .addOnCanceledListener {
                    Log.e(tag,"Barcode Reading Canceled")
                    imageProxy.close()
                }

        }
    }  

barcodeDetectListener是对我创建的接口的引用,该接口用于将此数据传回我的活动。

interface BarcodeDetectListener {
    fun onBarcodeDetect(code: String, codeBound: Rect, imageWidth: Int, imageHeight: Int)
}

在我的主要活动中,我将这些数据发送到OverlaySurfaceHolder实现SurfaceHolder.Callback. 此类负责在overlayed 上绘制边界框SurfaceView

override fun onBarcodeDetect(code: String, codeBound: Rect, analyzedImageWidth: Int,
                                 analyzedImageHeight: Int) {

        Log.i(TAG,"barcode : $code")
        overlaySurfaceHolder.repositionBound(codeBound,previewView.width,previewView.height,
            analyzedImageWidth,analyzedImageHeight)
        overlayView.invalidate()

    }

正如您在此处看到的,我正在发送覆盖SurfaceView的宽度和高度以在OverlaySurfaceHolder课堂上进行计算。

OverlaySurfaceHolder.kt

class OverlaySurfaceHolder: SurfaceHolder.Callback {

    var previewViewWidth: Int = 0
    var previewViewHeight: Int = 0
    var analyzedImageWidth: Int = 0
    var analyzedImageHeight: Int = 0

    private lateinit var drawingThread: DrawingThread
    private lateinit var barcodeBound :Rect

    private  val tag = OverlaySurfaceHolder::class.java.simpleName

    override fun surfaceChanged(holder: SurfaceHolder?, format: Int, width: Int, height: Int) {

    }

    override fun surfaceDestroyed(holder: SurfaceHolder?) {

        var retry = true
        drawingThread.running = false

        while (retry){
            try {
                drawingThread.join()
                retry = false
            } catch (e: InterruptedException) {
            }
        }
    }

    override fun surfaceCreated(holder: SurfaceHolder?) {
        drawingThread = DrawingThread(holder)
        drawingThread.running = true
        drawingThread.start()
    }

    fun repositionBound(codeBound: Rect, previewViewWidth: Int, previewViewHeight: Int,
                        analyzedImageWidth: Int, analyzedImageHeight: Int){

        this.barcodeBound = codeBound
        this.previewViewWidth = previewViewWidth
        this.previewViewHeight = previewViewHeight
        this.analyzedImageWidth = analyzedImageWidth
        this.analyzedImageHeight = analyzedImageHeight
    }

    inner class DrawingThread(private val holder: SurfaceHolder?): Thread() {

        var running = false

        private fun adjustXCoordinates(valueX: Int): Float{

            return if(previewViewWidth != 0){
                (valueX / analyzedImageWidth.toFloat()) * previewViewWidth.toFloat()
            }else{
                valueX.toFloat()
            }
        }

        private fun adjustYCoordinates(valueY: Int): Float{

            return if(previewViewHeight != 0){
                (valueY / analyzedImageHeight.toFloat()) * previewViewHeight.toFloat()
            }else{
                valueY.toFloat()
            }
        }

        override fun run() {

            while(running){

                if(::barcodeBound.isInitialized){

                    val canvas = holder!!.lockCanvas()

                    if (canvas != null) {

                        synchronized(holder) {

                            canvas.drawColor(Color.TRANSPARENT, PorterDuff.Mode.CLEAR)

                            val myPaint = Paint()
                            myPaint.color = Color.rgb(20, 100, 50)
                            myPaint.strokeWidth = 6f
                            myPaint.style = Paint.Style.STROKE

                            val refinedRect = RectF()
                            refinedRect.left = adjustXCoordinates(barcodeBound.left)
                            refinedRect.right = adjustXCoordinates(barcodeBound.right)
                            refinedRect.top = adjustYCoordinates(barcodeBound.top)
                            refinedRect.bottom = adjustYCoordinates(barcodeBound.bottom)

                            canvas.drawRect(refinedRect,myPaint)
                        }

                        holder.unlockCanvasAndPost(canvas)

                    }else{
                        Log.e(tag, "Cannot draw onto the canvas as it's null")
                    }

                    try {
                        sleep(30)
                    } catch (e: InterruptedException) {
                        e.printStackTrace()
                    }

                }
            }
        }

    }
}

请谁能指出我做错了什么?

4

3 回答 3

1

我没有非常明确的线索,但您可以尝试以下方法:

  1. 在调整XCoordinates 时,如果previewWidth 为0,则直接返回valueX.toFloat()。您可以添加一些日志记录以查看它实际上属于这种情况吗?添加一些日志来打印分析和预览维度也可能会有所帮助。

  2. 另一件值得注意的事情是,您发送到检测器的图像可能与预览视图区域具有不同的纵横比。例如,如果您的相机拍摄 4:3 的照片,它会将其发送到检测器。但是,如果您的查看区域是 1:1,它将裁剪部分照片以显示在那里。在这种情况下,您在调整坐标时也需要考虑到这一点。根据我的测试,图像将适合基于 CENTER_CROP 的视图区域。如果您想非常小心,可能值得检查这是否记录在相机开发站点中。

希望它或多或少有所帮助。

于 2020-05-29T17:58:17.083 回答
0

我不再从事这个项目。然而,我在一个使用 Camera 2 API 的相机应用程序上工作得非常好。在该应用程序中,需要使用 MLKit 对象检测库检测对象,并在相机预览顶部显示像这样的边界框。首先面临同样的问题,并最终设法让它工作。我将把我的方法留在这里。它可能会帮助某人。

与相机预览图像相比,任何检测库都会在小分辨率图像中进行检测过程。当检测库返回检测到的对象的组合时,我们需要放大以将其显示在正确的位置。它被称为比例因子。为了便于计算,最好选择相同纵横比的分析图像尺寸和预览图像尺寸。

您可以使用以下函数获取任意大小的纵横比。

fun gcd(a: Long, b: Long): Long {
    return if (b == 0L) a else gcd(b, a % b)
}
    
fun asFraction(a: Long, b: Long): Pair<Long,Long> {
    val gcd = gcd(a, b)
    return Pair((a / gcd) , b / gcd)
}

获取相机预览图像纵横比后,选择分析图像大小,如下所示。

val previewFraction = DisplayUtils
                      .asFraction(previewSize!!.width.toLong(),previewSize!!.height.toLong())
    
val analyzeImageSize = characteristics
                   .get(CameraCharacteristics.SCALER_STREAM_CONFIGURATION_MAP)!!
                   .getOutputSizes(ImageFormat.YUV_420_888)
                   .filter { DisplayUtils.asFraction(it.width.toLong(), it.height.toLong()) == previewFraction }
                   .sortedBy { it.height * it.width}
                   .first()

最后,当您拥有这两个值时,您可以计算如下所示的比例因子。

val scaleFactor = previewSize.width / analyzedSize.width.toFloat()

最后,在绘制边界框之前,将每个选项与比例因子相乘以获得正确的屏幕坐标。

于 2021-05-20T08:56:17.533 回答
-1

如果从位图检测,您的重新定位方法将在我尝试时正确。

于 2020-11-27T04:31:53.933 回答