c++ - 将 Mat 转换为 PIX 到 setImage

Question

我正在尝试从裁剪的图像中识别文本，但由于 X-Platform 编码，我需要将其传递给Matto 。PIX

并且执行相同的函数传递Mat并PIX使用相同的图像，结果非常不同（PIX它可以完美运行，Mat但它会变得混乱）。

我可能做错了什么？

谢谢。

PD：（这是我正在使用的代码片段之一）

String imgToString(const char* variables, Mat gray) {
    char *outText;

    tesseract::TessBaseAPI *api = new tesseract::TessBaseAPI();
    if (api->Init(NULL, "eng")) {
        String returnString = "Could not initialize tesseract.\n";
        fprintf(stderr, "Could not initialize tesseract.\n");
        return returnString;
    }
    api->SetVariable("tessedit_char_whitelist", variables);

    // Open input image with leptonica library
    api->TesseractRect(gray.data, 1, gray.channels() * gray.size().width, 0, 0, gray.cols, gray.rows);
    // Get OCR result
    outText = api->GetUTF8Text();
    return outText;
}

// The one below works fantastic

String imgToString(const char* variables, const char* filename) {
    char *outText;

    tesseract::TessBaseAPI *api = new tesseract::TessBaseAPI();
    if (api->Init(NULL, "eng")) {
        String returnString = "Could not initialize tesseract.\n";
        fprintf(stderr, "Could not initialize tesseract.\n");
        return returnString;
    }
    api->SetVariable("tessedit_char_whitelist", variables);

    // Open input image with leptonica library
    Pix *image = pixRead(filename);
    api->SetImage(image);
    // Get OCR result
    outText = api->GetUTF8Text();
    return outText;
}

score 1 · Accepted Answer

问题似乎在灰色图像中。正如 tesseract 的 pix.h 头文件所说，该库适用于每像素深度为 32 位的图像。tesseract 还对颜色进行加权，因此应该对它们进行右对齐（opencv 默认将颜色存储为 BGR，但 tesseract 等待 RGBA）。恢复：

#include <tesseract/baseapi.h>
#include <leptonica/allheaders.h>    
#include <opencv2/opencv.hpp>
...
char imagename[] = "testimg.jpg";
cv::Mat _mat = cv::imread(imagename);
cv::cvtColor(_mat, _mat, CV_BGR2RGBA); 
api.SetImage(_mat.data, _mat.cols, _mat.rows, 4, 4*_mat.cols);
char *outtext = api.GetUTF8Text();
...

c++ - 将 Mat 转换为 PIX 到 setImage

1 回答 1

Related

Reference