问题标签 [filesplitting]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2570 浏览

applescript - AppleScript中选择文件的文件夹路径

我正在创建简单的脚本来使用 shell 脚本转换 mp3 文件。我决定使用 applescript 自动化我的转换。基本上我正在做的是选择 mp3 文件,然后使用我的命令行拆分该文件,我想创建一个文件所在的文件夹(脚本将为我创建该文件夹)。

现在我只需要弄清楚如何获取文件文件夹的路径。我如何在applescript中做到这一点?

这是我到目前为止的脚本:

现在该脚本所做的是在我的硬盘驱动器的根目录上创建文件夹,我需要位于文件所在的文件夹中。

任何帮助将不胜感激。

0 投票
0 回答
489 浏览

grails - 如何将大文件拆分为小块(在 Grails 中)以便作为 BLOB 插入数据库

我们正在使用 Grails 2.0.1 我有一个控制器,它从我的 GSP 读取上传的文件作为输入流,我想在控制器中将此文件拆分为块,以便能够以 BLOB 类型的形式插入文件数据我的底层数据库。!请帮助 java.sql.BLOB 中是否有任何特殊功能?

0 投票
1 回答
509 浏览

java - 在 Java 中,我想将一个数组拆分为更小的数组,其长度因输入的文本文件而异

到目前为止,我有 2 个数组:一个带有股票代码,一个带有文件名列表。我想要做的是从第二个数组的每个文件名中输入 .txt 文件,然后将此输入拆分为: 1. 每个文件的数组 2. 每个文件的每个部分的数组。

我有这个:

这种方法可以创建一个包含所有文件的大数组,更改输入法以在输入时拆分它或拆分我拥有的大数组会更容易吗?

此时,股票代码数组无关紧要。一旦我将数组拆分,我就知道我将从那里去哪里。

谢谢。

编辑:我知道这段代码在 { } 方面是不完整的,但它只是打印流和调试错过了。

0 投票
1 回答
1986 浏览

python - 如何使用 python 的 zipfile 库检查 zip 文件是否在多个档案中分割?

根据 zip 文件标准:http ://www.pkware.com/documents/casestudies/APPNOTE.TXT它还支持将 zip 文件拆分为多个文件:

知道如何检查该签名或其他方式来检查一个 zip 是否拆分为多个文件吗?

0 投票
1 回答
470 浏览

hdfs - Hadoop分布文件系统

我想修改将输入文件拆分为块并存储在 Hadoop 分布式文件系统中的方式。(例如,它根据块大小拆分文件,但我的应用程序需要根据文件内容拆分文件)。所以我想确切地知道根据HADOOP的块大小属性将文件分成块的类。

0 投票
1 回答
3856 浏览

java - Hadoop FileSplit 读取

假设一个客户端应用程序使用一个FileSplit对象来从相应的文件中读取实际字节。

为此,必须通过以下代码InputStream从 中创建一个对象:FileSplit

在某些场景中,例如类,会出现将流调整为 -1 的情况Hadoop MapReduce LineRecordReader。但是,该FSDataInputStream seek()方法的文档明确指出,在寻找到一个位置之后,下一次读取将来自该位置,这意味着(?)上面的代码将是 1 个字节(?)。

所以,问题是,对于所有 InputSplit 阅读案例是否需要“-1”调整?

顺便说一句,如果想要FileSplit正确读取一个文件,仅寻找它的开头是不够的,因为每个拆分也有一个结尾,可能与实际 HDFS 文件的结尾不同。因此,对应的InputStream应该是“有界的”,即具有最大长度,如下所示:

fsin在这种情况下,在上面创建了“本机”流之后,使用org.apache.commons.io.input.BoundedInputStream该类来实现“边界”。

更新

显然,仅当用例排在该类中时才需要进行调整LineRecordReader,这超出了拆分的边界,以确保它读取完整的最后一行。

可以在较早的问题MAPREDUCE-772的评论中找到有关此问题的详细讨论。

0 投票
2 回答
4324 浏览

java - 将数字拆分为相等的部分,其中最后一部分等于或低于其余部分

我有一个文件,我想分成 100 份。
文件大小为 257019 字节。
在下面运行我的拆分器代码时,我得到 99 个大小为 2545 字节的部分,最后 100 个部分是 5064 字节。

我需要帮助来弄清楚如何使前 99 个部分具有相同的大小,而最后 100 个部分的剩余字节数等于或低于 2545。

0 投票
4 回答
373 浏览

python - 在更改值时使用 python 拆分排序文件

我是 python 新手。我的要求(如果我必须使用 awk 的话很简单)如下所示,

下面提到的文件(test.txt)是制表符分隔的,

我想要的输出

文件 1.txt 应具有以下值

文件 2.txt 应具有以下值

文件 3.txt 应具有以下值

原始文件按第一列排序。我不知道我必须拆分的行号。它必须在价值变化上。使用awk,我会这样写

(性能方面,python 会更好吗?)

0 投票
1 回答
447 浏览

hadoop - HDFS FileSplit locations

I have a cluster with an installation of hadoop-2.1.0-beta. Is there a way to learn where each filesplit is located in my cluster? What I am looking for is a list such as the following

edit: I know that such a list is available in Microsoft Azure.

0 投票
1 回答
386 浏览

c++ - C++ 强力球 - 文件拆分和错误 (gameType)

自从我完成 C++ 以来已经有一段时间了,但我正在尝试将这个程序分成三个文件。(Driver.cpp、Powerball.cpp 和 Powerball.h),我认为一切都在正确的位置。使用当前版本,我在运行它时收到以下错误消息。任何帮助或指示都是有帮助的!谢谢!

错误

Driver.cpp (56): error C2660: 'game' : function does not take 1 arguments

(58): 错误 C2360: 'gameType' 的初始化被'case' 标签跳过

(55) : 见 'gameType' 的声明

(61): 错误 C2361: 'gameType' 的初始化被'default' 标签跳过

(55) : 见 'gameType' 的声明

驱动程序.cpp

强力球.h

强力球.cpp