2

我觉得我在这里遗漏了一些简单的东西(像往常一样)。

我正在尝试使用 Java 读取 PGM 图像。Matlab 做得很好 - 在 Matlab 中输出图像像素(例如,一个小的 32x32 图像)给了我这样的东西:

1 0 11 49 94 118 118 106 95 88 85 96 124 143 142 133

然而,我的 Java 阅读器输出如下:

1 0 11 49 94 118 118 106 95 88 85 96 124 65533 65533 65533

看起来 127 以上的像素值用 65533 填充,尽管它确实得到了一些不正确的随机值,甚至将几乎整个底行分配为 -1 的值。

这是我正在使用的代码:

文件路径 = 'imagepath.pgm';
FileInputStream fileInputStream = new FileInputStream(filePath);
BufferedReader bufferedReader = new BufferedReader(new InputStreamReader(fileInputStream));

// 读取头信息 ...

int [][] data2D = new int [picWidth] [picHeight];

for (int row = 0; row < picHeight; row++) {
  for (int col = 0; col < picWidth; col++) {
    data2D[row][col] = bufferedReader.read();
    System.out.print(data2D[row][col] + "");
  }
  System.out.println();
}

文件输入流.close();

任何想法将不胜感激。

编辑这里是无符号 PGM 值:

     1 0 11 49 94 118 118 106 95 88 85 96 124 143 142 133
    30 26 29 57 96 122 125 114 102 94 91 101 127 146 145 136
    96 85 70 75 101 128 136 126 111 106 106 112 131 149 153 147
   163 147 114 93 99 120 132 123 110 113 124 129 137 154 166 168
   215 195 149 105 88 99 114 111 106 123 148 158 160 174 191 197
   245 224 173 115 81 82 100 109 117 144 179 194 194 205 222 230
   235 217 170 115 78 78 113 117 100 83 80 212 214 226 244 253
   178 167 135 93 68 78 123 129 106 77 69 202 204 222 244 255
   114 110 92 64 54 81 107 105 83 59 56 182 184 201 222 231
    79 80 71 52 55 97 67 55 41 33 42 184 179 181 185 183
    62 66 65 52 63 115 29 16 12 17 30 209 197 174 150 132
    40 47 52 44 55 109 171 196 188 186 208 229 218 179 136 107
    31 38 44 37 43 89 145 167 158 159 191 223 219 179 133 105
    48 52 56 51 57 91 128 133 117 120 157 196 200 168 128 105
    64 67 70 73 87 114 127 107 79 81 118 159 173 154 123 104
    63 67 73 83 107 132 129 91 54 54 88 130 153 146 123 106

标题如下所示:

P5
# MatLab PGMWRITE 文件,保存于 2002 年 6 月 27 日
16 16
255

编辑#2

下面是概念验证代码的完整输出:

跳过未知标记:“”
跳过未知标记:“1^vvj_XU`|���”
跳过未知标记:“”
跳过未知标记:“9`z}rf^[e���`UFKe��~ojjp������r]cx�{nq|������ÕiXcroj{������� �sQRdmu��������٪sNNqudSP�����]DN{�jME�����rn\@6QkiS;8�����OPG47aC7)!*������>BA4? s"
跳过未知标记:“”
跳过未知标记:“”
跳过未知标记:“�Ů��(/4,7m�ļ���ڳ�k"
跳过未知标记:“&,%+Y������۳�i04839[��ux������i@CFIWrkOQv���{h?CISk��[66X���{j”
线程“主”java.util.NoSuchElementException 中的异常
    在 java.util.Scanner.throwFor(Scanner.java:838)
    在 java.util.Scanner.next(Scanner.java:1347)
    在 Test.main(Test.java:49)

抛出的异常中提到的第 49 行是:

System.out.println(String.format("Skipping unknow token: \"%s\"", scan.next()));

我敢肯定,这个问题与这些图像文件由 ASCII 文本/数字以及二进制图像数据组成的事实有关。但是如果 Java 读取 PNG 没有问题,为什么缺少对 PGM 的支持呢?

编辑 3

好的,我找到了一个可行的实现......不幸的是,它已被弃用:

  filePath = "imagepath.pgm"
  FileInputStream fileInputStream = new FileInputStream(filePath);
  DataInputStream dis = new DataInputStream(fileInputStream);
  StreamTokenizer streamTokenizer = new StreamTokenizer(dis);

  // read header text using StreamTokenizer.nextToken()

  data2D = new int [picWidth] [picHeight];
  for (int row = 0; row < picHeight; row++) {
    for (int col = 0; col < picWidth; col++) {
      data2D[row][col] = dis.readUnsignedByte();
      System.out.print(data2D[row][col] + " ");
    }
    System.out.println();
  }

根据 Java 文档,StreamTokenizer(InputStream)构造函数已被弃用,因为该DataInputStream.readLine()方法不能正确地将原始字节转换为字符。但是,它似乎适用于标题的这种特定情况,并且显然适用于随后的二进制图像数据。

不幸的是,它仍然被弃用,并且似乎通过混合 a如文档所建议的那样仅在读取标头并尝试使用读取原始字节后BufferedReader导致s 。仍在寻找解决方案...EOFExceptionDataInputStream

4

1 回答 1

7

您的代码的问题是您使用错误的类从文件中读取原始数据。正如BufferedReader文档所说:

public int read() throws IOException

读取单个字符。

返回: 读取的字符,为 0 到 65535 (0x00-0xffff) 范围内的整数,如果已到达流的末尾,则返回 -1

所以每次调用 的read()方法BufferedReader实际上会消耗输入流中的一两个字节(基于字符编码),这不是您想要的。这也解释了为什么你会得到很多 -1:流结束的时间比你想象的要早得多。

由于 PGM 包含 ASCII 十进制值,因此使用Scanner类很容易解析。

这是一个几乎未经测试的代码,它显示了如何读取 PGM 图像,假设:

  • 它在幻数之后包含一个注释(即除了第二个之外,它没有以 # 开头的行)
  • PGM 文件正好有 4 行长。

这是代码:

String filePath = "image.pgm";
fileInputStream = new FileInputStream(filePath);
Scanner scan = new Scanner(fileInputStream);
// Discard the magic number
scan.nextLine();
// Discard the comment line
scan.nextLine();
// Read pic width, height and max value
int picWidth = scan.nextInt();
int picHeight = scan.nextInt();
int maxvalue = scan.nextInt();

fileInputStream.close();
            
 // Now parse the file as binary data
 fileInputStream = new FileInputStream(filePath);
 DataInputStream dis = new DataInputStream(fileInputStream);
 
 // look for 4 lines (i.e.: the header) and discard them
 int numnewlines = 4;
 while (numnewlines > 0) {
     char c;
     do {
         c = (char)(dis.readUnsignedByte());
     } while (c != '\n');
     numnewlines--;
 }

 // read the image data
 int[][] data2D = new int[picHeight][picWidth];
 for (int row = 0; row < picHeight; row++) {
     for (int col = 0; col < picWidth; col++) {
         data2D[row][col] = dis.readUnsignedByte();
         System.out.print(data2D[row][col] + " ");
     }
     System.out.println();
 }

需要实现:支持注释行,每个元素的值应该除以maxvalue,错误文件的错误检查,异常处理。我使用 UNIX 行尾在 PGM 文件上对其进行了测试,但它也应该在 Windows 上工作。

让我强调一下,这不是 PGM 解析器的健壮也不完整的实现。此代码旨在作为概念证明,可能足以满足您的需求。

如果你真的需要一个强大的 PGM 解析器,你可以使用Netpbm提供的工具。

于 2010-09-03T20:27:31.717 回答