4

我需要检查currentFileMIME 类型。如果结果是成功并且文件具有 MIME-type return true。如果没有检查成功return false
为了这个目标,我使用JMimeMagic
我试着按照这篇文章做这个

此代码的输出是 -net.sf.jmimemagic.MagicMatchNotFoundException

您需要JDK 7 - 以这种方式将 File 更改为 byte[](Files.readAllBytes(path))。

代码:

    class ProbeContentTypeCheker implements Checker {

    @Override
    public boolean check(File currentFile) {
        String mimeType = null;
        try {
            Path path = Paths.get(currentFile.getAbsolutePath());
            byte[] data = Files.readAllBytes(path);
            MagicMatch match = Magic.getMagicMatch(data);
            mimeType = match.getMimeType();
        } catch (MagicParseException | MagicMatchNotFoundException
                | MagicException | IOException e) {
            e.printStackTrace();
        }

        if (null != mimeType) {
            return true;
        }

        return false;
    }
}

输出(仅当它是“错误”类型时):

 net.sf.jmimemagic.MagicMatchNotFoundException
    at net.sf.jmimemagic.Magic.getMagicMatch(Magic.java:222)
    at net.sf.jmimemagic.Magic.getMagicMatch(Magic.java:170)
    at task.ProbeContentTypeCheker.check(FileScan.java:357)
    at task.FolderScan.findFiles(FileScan.java:223)
    at task.FolderScan.findFiles(FileScan.java:215)
    at task.FolderScan.run(FileScan.java:202)
    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1110)
    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:603)
    at java.lang.Thread.run(Thread.java:722)  

如果文件是“ok”类型 => 输出到控制台正常。但一段时间后出现另一个例外

Exception in thread "pool-1-thread-1" java.lang.OutOfMemoryError: Java heap space
    at java.lang.String.toCharArray(String.java:2753)
    at org.apache.oro.text.perl.Perl5Util.match(Unknown Source)
    at net.sf.jmimemagic.MagicMatcher.testRegex(MagicMatcher.java:663)
    at net.sf.jmimemagic.MagicMatcher.testInternal(MagicMatcher.java:433)
    at net.sf.jmimemagic.MagicMatcher.test(MagicMatcher.java:341)
    at net.sf.jmimemagic.Magic.getMagicMatch(Magic.java:208)
    at net.sf.jmimemagic.Magic.getMagicMatch(Magic.java:170)
    at task.ProbeContentTypeCheking.check(FileScan.java:384)
    at task.FolderScan.findFiles(FileScan.java:228)
    at task.FolderScan.findFiles(FileScan.java:225)
    at task.FolderScan.findFiles(FileScan.java:225)
    at task.FolderScan.run(FileScan.java:209)
    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1110)
    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:603)
    at java.lang.Thread.run(Thread.java:722)

问题:

  • 出现这种异常怎么解决?
4

1 回答 1

3

JMimeMagic 0.1.2依赖于 Commons Logging 1.0.4 NoClassDefFoundError意味着 Java 虚拟机或 ClassLoader 实例尝试加载类的定义(作为普通方法调用的一部分或使用新表达式)并且找不到类的定义。解决方案是将 commons-logging-1.0.4.jar 添加到您的类路径中。

请注意,JMimeMagic 有其他3rd 方依赖项:

  1. 雅加达 ORO 2.0.8
  2. Log4j 1.2.8
  3. Xerces 2.4.0(可选)
  4. xml-apis 2.0.2
  5. xmlParserAPI 2.0.2

更新 - MagicMatchNotFoundException

如果未找到与提供的数据匹配的 mime 类型,则会引发MagicMatchNotFoundException 您可以将日志级别设置net.sf.jmimemagic为 DEBUG 以获取有关正在发生的事情的更多信息

更新 2 - OutOfMemoryError

OOM 看起来与 JmimeMagic 的行为有关。在某些情况下,它会尝试对整个字节数组输入运行正则表达式以查找幻数匹配。有关 Nuxeo 企业平台,请参阅此报告的问题
我认为您可以通过限制传递给的字节数组的大小来解决此问题getMagicMatch

于 2013-03-10T22:26:28.033 回答