java - 访问文件时 TPath 忽略大小写 [Java TrueZip]

Question

有没有办法在使用 TrueZip 忽略文件名大小写的同时访问存档中的文件？

想象一下带有内容的 zip 存档：

MyZip.zip
-> myFolder/tExtFile.txt
-> anotherFolder/TextFiles/file.txt
-> myFile.txt
-> anotherFile.txt
-> OneMOREfile.txt

这是它的工作原理：

TPath tPath = new TPath("MyZip.zip\\myFolder\\tExtFile.txt");
System.out.println(tPath.toFile().getName()); //prints tExtFile.txt

如何执行相同但忽略所有大小写，如下所示：

// note "myFolder" changed to "myfolder" and "tExtFile" to "textfile"    
TPath tPath = new TPath("MyZip.zip\\myfolder\\textfile.txt");
System.out.println(tPath.toFile().getName()); // should print tExtFile.txt

上面的代码抛出FsEntryNotFoundException ... (no such entry)

它适用于常规java.io.File，不确定为什么不适用于TFileTrueZip 或我遗漏了什么？

我的目标是仅对文件和文件夹使用小写字母来访问每个文件。

编辑：24-03-2017

假设我想从提到的 zip 存档中的文件中读取字节MyZip.zip

Path tPath = new TPath("...MyZip.zip\\myFolder\\tExtFile.txt");
byte[] bytes = Files.readAllBytes(tPath); //returns bytes of the file

上面的这个片段有效，但下面的这个片段不起作用（提到的抛出 -> FsEntryNotFoundException）。它是相同的路径和文件，只是小写。

Path tPath = new TPath("...myzip.zip\\myfolder\\textfile.txt");
byte[] bytes = Files.readAllBytes(tPath);

score 1 · Accepted Answer

你说：

我的目标是仅对文件和文件夹使用小写字母来访问每个文件。

但是一厢情愿的想法不会让你走得太远。事实上，大多数文件系统（Windows 类型除外）都是区分大小写的，即在它们中使用大写或小写字符会产生很大的不同。在那里，您甚至可以在同一目录中多次使用不同大小写的“相同”文件名。file.txt也就是说，如果名称是,File.txt或，它实际上会有所不同file.TXT。Windows 在这里确实是一个例外，但 TrueZIP 不模拟 Windows 文件系统，而是模拟适用于所有平台上的 ZIP、TAR 等的通用存档文件系统。因此，您无法选择是使用大写还是小写字符，但您必须完全按照 ZIP 存档中存储的方式使用它们。

更新：作为一个小证据，我使用 extfs 文件系统登录到远程 Linux 机器并执行以下操作：

~$ mkdir test
~$ cd test
~/test$ touch file.txt
~/test$ touch File.txt
~/test$ touch File.TXT
~/test$ ls -l
total 0
-rw-r--r-- 1 group user 0 Mar 25 00:14 File.TXT
-rw-r--r-- 1 group user 0 Mar 25 00:14 File.txt
-rw-r--r-- 1 group user 0 Mar 25 00:14 file.txt

如您所见，有三个不同的文件，而不仅仅是一个。

如果将这三个文件压缩到存档中会发生什么？

~/test$ zip ../files.zip *
  adding: File.TXT (stored 0%)
  adding: File.txt (stored 0%)
  adding: file.txt (stored 0%)

添加了三个文件。但是它们是否仍然在存档中区分文件，还是仅以一个名称存储？

~/test$ unzip -l ../files.zip
Archive:  ../files.zip
  Length      Date    Time    Name
---------  ---------- -----   ----
        0  2017-03-25 00:14   File.TXT
        0  2017-03-25 00:14   File.txt
        0  2017-03-25 00:14   file.txt
---------                     -------
        0                     3 files

“3 个文件”，它说 - quod erat demostrandum。

如您所见，Windows 并不是整个世界。但是，如果您将该存档复制到 Windows 机器并在那里解压缩，它只会将一个文件写入具有 NTFS 或 FAT 文件系统的磁盘 - 这是一个运气问题。如果三个文件的内容不同，那就太糟糕了。

更新 2：好的，由于上面详细解释的原因，TrueZIP 中没有解决方案，但如果你想解决它，你可以像这样手动完成：

package de.scrum_master.app;

import de.schlichtherle.truezip.nio.file.TPath;

import java.io.IOException;
import java.net.URISyntaxException;
import java.nio.file.Files;

public class Application {
  public static void main(String[] args) throws IOException, URISyntaxException {
    TPathHelper tPathHelper = new TPathHelper(
      new TPath(
        "../../../downloads/powershellarsenal-master.zip/" +
          "PowerShellArsenal-master\\LIB/CAPSTONE\\LIB\\X64\\LIBCAPSTONE.DLL"
      )
    );
    TPath caseSensitivePath = tPathHelper.getCaseSensitivePath();
    System.out.printf("Original path: %s%n", tPathHelper.getOriginalPath());
    System.out.printf("Case-sensitive path: %s%n", caseSensitivePath);
    System.out.printf("File size: %,d bytes%n", Files.readAllBytes(caseSensitivePath).length);
  }
}

package de.scrum_master.app;

import de.schlichtherle.truezip.file.TFile;
import de.schlichtherle.truezip.nio.file.TPath;

import java.io.IOException;
import java.net.URISyntaxException;
import java.nio.file.Path;

public class TPathHelper {
  private final TPath originalPath;
  private TPath caseSensitivePath;

  public TPathHelper(TPath tPath) {
    originalPath = tPath;
  }

  public TPath getOriginalPath() {
    return originalPath;
  }

  public TPath getCaseSensitivePath() throws IOException, URISyntaxException {
    if (caseSensitivePath != null)
      return caseSensitivePath;
    final TPath absolutePath = new TPath(originalPath.toFile().getCanonicalPath());
    TPath matchingPath = absolutePath.getRoot();
    for (Path subPath : absolutePath) {
      boolean matchFound = false;
      for (TFile candidateFile : matchingPath.toFile().listFiles()) {
        if (candidateFile.getName().equalsIgnoreCase(subPath.toString())) {
          matchFound = true;
          matchingPath = new TPath(matchingPath.toString(), candidateFile.getName());
          break;
        }
      }
      if (!matchFound)
        throw new IOException("element '" + subPath + "' not found in '" + matchingPath + "'");
    }
    caseSensitivePath = matchingPath;
    return caseSensitivePath;
  }
}

当然，这有点难看，如果存档中有多个不区分大小写的匹配项，它只会为您提供第一个匹配路径。该算法将在每个子目录中的第一个匹配项之后停止搜索。我对这个解决方案并不特别自豪，但这是一个很好的练习，你似乎坚持要这样做。我只是希望您永远不会遇到在区分大小写的文件系统上创建并包含多个可能匹配项的 UNIX 样式 ZIP 存档。

顺便说一句，我的示例文件的控制台日志如下所示：

Original path: ..\..\..\downloads\powershellarsenal-master.zip\PowerShellArsenal-master\LIB\CAPSTONE\LIB\X64\LIBCAPSTONE.DLL
Case-sensitive path: C:\Users\Alexander\Downloads\PowerShellArsenal-master.zip\PowerShellArsenal-master\Lib\Capstone\lib\x64\libcapstone.dll
File size: 3.629.294 bytes

score 0 · Accepted Answer

我没有安装TrueZip，但我也想知道它如何正常工作Path，所以我以非常相似的方式实现了 @kriegaex 解决方案，您可以尝试使用caseCheck(path)：

public class Main {

    /**
     * @param args
     * @throws Exception
     */
    public static void main(String[] args) throws Exception {

        Path path = Paths.get("/home/user/workspace/JParser/myfolder/yourfolder/Hisfolder/a.txt");

        Instant start = Instant.now();
        Path resolution;
        try{
            resolution = caseCheck(path);
        }catch (Exception e) {
            throw new IllegalArgumentException("Couldnt access given path", e);
        }
        Instant end = Instant.now();

        Duration duration = Duration.between(start, end);

        System.out.println("Path is: " + resolution + " process took " + duration.toMillis() + "ms");

    }

    /**
     * @param path
     * @return
     * @throws IOException
     */
    private static Path caseCheck(Path path) throws IOException {

        Path entryPoint = path.isAbsolute() ? path.getRoot() : Paths.get(".");
        AtomicInteger counter = new AtomicInteger(0);
        while (counter.get() < path.getNameCount()) {
            entryPoint = Files
                    .walk(entryPoint, 1)
                    .filter(s -> checkPath(s, path, counter.get()))
                    .findFirst()
                    .orElseThrow(()->new IllegalArgumentException("No folder found"));

            counter.getAndIncrement();

        }

        return entryPoint;

    }

    /**
     * @param s
     * @param path
     * @param index
     * @return
     */
    private static final boolean checkPath(Path s, Path path, int index){
        if (s.getFileName() == null) {
            return false;
        }
        return s.getFileName().toString().equalsIgnoreCase(path.getName(index).toString());
    }
}

java - 访问文件时 TPath 忽略大小写 [Java TrueZip]

2 回答 2

Related