问题标签 [apache-commons-compress]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
872 浏览

java - 读取 tar.gz 存档中 CSV 文件的内容

我想将tar.gz存档的内容保存在数据库表中。

存档包含CSV格式的 txt 文件。

这个想法是在数据库中为 txt 文件中的每一行插入一个新行。

问题是我无法单独读取文件的内容然后继续下一个文件。

EntryTable和EntryTableLine下面是 Hibernate 实体。

EntryTable与EntryTableLineOneToMany关系(一个文件 -EntryTable- 可以有很多行 -EntryTableLine-)。

我尝试将tarEntry.getFile()转换为InputStream,但不幸的是tarEntry.getFile()为空。

假设我在存档中有 4 个文件。每个文件里面有 3 行。但是,在数据库中,一些条目有 5 行,而另一些则没有。

谢谢 !

0 投票
1 回答
364 浏览

java - 如何使用 Apache Commons 解压缩 BZIP(不是 BZIP2)

我一直致力于从不同类型的文件格式中解压缩,例如"zip,tar,tbz,tgz"。除了 tbz 之外,我什么都能做,因为apache 通用压缩库提供 BZIP2 压缩器。但我需要解压缩旧的 BZIP 而不是 BZIP2。有没有办法做到这一点。我已经添加了到目前为止我已经完成的代码,用于使用下面的 apache commons 库提取不同的 tar 文件存档。

0 投票
0 回答
47 浏览

java - Java 解压缩 5G 7z 文件

我正在尝试使用Apache commons compress版本 1.9 解压缩 5G 文本文件...

我只得到前 1 GB

有什么建议/替代方案吗?交换到另一个库不是问题。

解决了...对缓冲区的迭代是错误的。

0 投票
1 回答
365 浏览

java - jar libs\commons-compress-1.18.jar 有一个主类 org.apache.commons.compress.archivers.Lister 与声明的 main 不匹配

我正在开发一个Javafx应用程序并准备好构建。为了读取和写入 excel 文件,我使用org.apache.commons.compress库(一个jar文件),其中有一个名为的主类Lister。其中,我的应用程序有自己的MainApp类文件(对应用程序至关重要Javafx)。所以,当我构建应用程序时,构建成功并且我的应用程序的 jar 文件也生成了,但我收到了这个错误:

这意味着我的 jar 中有两个主要文件。

其次,当我运行我的应用程序的可执行 jar 时,它会崩溃。

0 投票
1 回答
93 浏览

java - Apache common compress 在包含到 android 项目时给出奇怪的错误

自从我在我的 gradle 文件中包含 apache common compress 以来,我遇到了奇怪的错误。

我是怎么做到的

这些是我得到的错误

Java 错误

D8 错误

我到处搜索,似乎无法理解错误的含义。有人可以帮我吗

0 投票
0 回答
132 浏览

java - TestNG 单元测试 Tar 和 7z

文件夹结构在这里

控制台输出在这里

我想为以下两种方法编写一个测试类

我使用 testNG 并尝试从文件夹中读取,过滤文件夹以获取某些扩展名(.tar 和 .7z),将这些文件提供给解压缩方法,并将结果与​​带有 AssertEquals 的实际输出文件夹进行比较。我设法从文件夹中读取文件名(请参阅控制台输出),但无法将它们提供给 decompressTar(字符串输入,文件输出)。这是因为“结果”是一个字符串数组,我需要一个字符串吗?我不知道 TestNG 的 DataProvider 如何处理数据。任何帮助将不胜感激:)谢谢:)

0 投票
1 回答
156 浏览

apache-commons-compress - Apache commons-压缩

我正在使用 commons-compress 处理 tarball 文件,并注意到即使不是 tar 的文件似乎也被处理了。为什么会这样——是否有更好的库来检测有效的 tar 文件

bug689.csv是一个 CSV 文件,测试失败是因为 te.isFile() 显然返回 true。te.getName() 似乎返回了 CSV 的内容。这是我错误地使用包的错误吗 - 我希望 InputStream 不能成功转换为 TarArchiveEntry

0 投票
1 回答
279 浏览

java - 从临时目录读取 SQLite 文件时获取 java.io.EOFException

从临时目录读取文件时,我看到EOFException异常。SQLite以下是读取文件的代码。而且并不总是看到例外。考虑到 50K 个文件,它会出现 3 到 4 次。

我正在使用以下依赖项进行解压

异常 while (-1 != (length = lzmaInputStream.read(buffer))) {在行抛出。以下是例外。

任何人都对以下构造函数有任何想法commons-compress

当我阅读LZMA 流时,我们需要将未压缩的大小传递给此处的构造函数 --> https://issues.apache.org/jira/browse/COMPRESS-286?page=com.atlassian.jira.plugin.system。 issuetabpanels%3Acomment-tabpanel&focusedCommentId=14109417#comment-14109417

0 投票
0 回答
37 浏览

java - 以严格的方式验证 zip 存档

有一个半损坏的 zip-archive 可以从中提取,但会提供一个半损坏的文件。

Ubuntu Archive Manager 从存档中提取,但给出警告:

在此处输入图像描述

以下 Java 代码完全没有错误:

依赖项:

NB档案的内容是一个单一的文本文件(这是事先同意的)。

Q.如何严格验证 zip 文件,使其在这种情况下被视为无效?

PS可以使用 apache-commons-compress 以外的其他库重写代码。最终目标是验证可靠性。

0 投票
0 回答
51 浏览

tar - tar.gz 存档中的文件组织

虽然我观察到通常文件夹中的文件在一个例外情况下在 tar.gz 存档中按顺序列出,但我发现它以随机方式列出。例如,假设有 a、b 和 c 三个文件夹,每个文件夹包含 1、2、3 文件。在通常情况下,存档条目将列在 a/1、a/2、a/3、b/1、b/2、b/3、c/1、c/2、c/3 中,但在此情况类似于 b/2, a/1, b/4, ... 为什么会发生这种情况?我使用第一个组织假设来读取 .tar.gz 存档文件并在文件夹级别对内部数据进行一些处理。无需每次都遍历整个档案并生成父/子结构,如果我可以为此类情况对文件夹列表进行内联排序,则无需任何想法。下面的示例代码:

我找不到任何可以给我这样一个内联排序列表的 API。如果有人在这里帮助我,那将非常有帮助。我被这个案子困住了。