问题标签 [csplit]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
51 浏览

logging - 根据日期前缀拆分文件?

我有这个文件.log

我想根据日期分区进行拆分,所以我得到了,

Sep_16.log

Sep_17.log

我在论坛中搜索,它应该是 usingcsplit和 regex ^.{6},但我得到的答案只是将 regex 用作分隔符,这不是我想要的。

另外,我想为每个日期分区拆分 10k 行,因此文件名将类似于 Sep_17_part001.log,然后将使用诸如前缀和后缀选项之类的东西。

有人知道这样做的完整命令吗?如果我在一个日志上做这一次的事情,我怎样才能让它每天运行,而不用 csplit 覆盖前几天?

0 投票
1 回答
29 浏览

r - 如何转换我的数据框以制作行列?

我有一个包含两列“类型”和“统计”的数据框。我希望每种类型都有一行,所有统计信息都在单独的列中。例如,我的数据框看起来像这样:

我希望它看起来像:

并非所有类型都具有相同数量的统计信息,某些类型缺少统计值,而其他类型则有额外的。我尝试使用 t(),但遇到了问题。然后,我尝试将 Stat 的所有值合并到一列并用 and 分隔gsub()csplit()但是我遇到了将每种类型的所有 Stat 值合并到一列的问题。有什么建议吗?

0 投票
0 回答
105 浏览

linux - 有没有办法让 split / csplit 在带有换行符的列的 linux 系统上工作?

我在尝试将较大的文件拆分成一堆较小的文件时遇到问题,其中一列中有新行。在我尝试拆分的 CSV 文件中,它的分隔符是管道 (|),每一行由换行符 (\n) 分隔。由于 1 列中有一堆换行符,它可能导致该 CSV 文件看起来像这样:

col1 | col2 | col3| 在这里插入一些东西

这就是意义

新文件

或格式

随机文本

正文 | col5 | col6 | col7

拆分时,它可能会导致我的文档(如果使用按行或字节拆分)仅在 col4 的中间拆分。如果发生这种情况,文件就会被弄乱,我以后无法处理它以将该数据插入我的表中。

我尝试使用 split 和 csplit,但我不确定是否可以根据行 + 分隔符实现良好的拆分。如果我尝试在匹配的地方使用 csplit 正则表达式(| 和换行符),它只会选择这个: text | col5 | col6 | col7 -> 所以不幸的是它也不起作用。

这里的解决方案用完了,也许 split 和 csplit 根本不可能,但我愿意接受建议。谢谢!

0 投票
2 回答
54 浏览

unix - 在文件末尾匹配后拆分文件并将匹配保留在文件 unix 中

我有一个包含随机行和关键词END的文件:

我想根据关键字 END 将其拆分为多个文件,并将其放在每个文件中:文件 1

文件 2

我试过了:

0 投票
1 回答
106 浏览

linux - 从一个文件创建多个名称与模式匹配的文件

我有一个文本文件,例如:

我想创建多个文本文件,其内容介于每个“--”之间。文本文件将以“>”开头的字符串命名。

最后我会有这些文本文件:

具有以下内容:

Tolten.WP_096573835.1文本文件:

Trivar.WP_011317016.1文本文件:

uniSU2.WP_085434158.1

Chlfri.WP_016876644.1文本文件:

>Noslin.WP_099070767.1文本文件:

我知道 csplit 适用于这种事情:

但我无法正确命名文件。

有谁知道如何提供帮助?

提前致谢 :)

0 投票
0 回答
22 浏览

xml - 使用 CSPLIT 的具有多个 Doctype 声明的文件

我有一个包含多个 Doctype 声明的文件。我正在尝试使用 CSPLIT 将文件分成更小的块,但遇到了一些问题。这是我正在使用的文件的示例:

这是我的命令:

以下是错误:

任何解决方案将不胜感激。谢谢!

0 投票
2 回答
68 浏览

html - 如何根据 RegEx 模式将文件拆分为多个文件?

我想根据特定的正则表达式模式将一个文件拆分为多个文件。我在下面提供了一个可重现的示例。如果有更简单的解决方案,我也欢迎!

我有一个包含以下文件的目录:

page1.html page2.html page3.html

假设我的 page1.html 看起来像这样:

我想将 page1.html 拆分为:

page1_0.html

page1_1.html

page1_2.html

我想要用以下模式识别行的代码:

[0 to 10 characters in the beginning] , Page (1 [0 to 10 characters here]). </p>

我目前有以下代码:

for filename in *.html; gcsplit -z -f "${filename%.*}_" --suffix-format="%d.html" $filename /'Page (1'/ '{*}'

但这是创建一个 page1_3.html 包含以下文本:

但是当我运行这个时:

这只是输出文件 page1_0.html。

我的正则表达式有什么问题?有没有其他方法可以实现我想要做的事情?

0 投票
1 回答
98 浏览

unix - 将大文件一分为二,同时保留标题

我有一个非常大的文本文件(约 1.8TB),需要在某个条目处拆分。我知道这个条目在哪一行,但我也可以通过 grep 命令识别它。从这个条目开始,我只关心文件的一部分。

我看到像 csplit 这样的某些 Unix 命令可以做到这一点。但是,该文件也有一个重要的标题(30 行长),重要的是新创建的文件也包含此标题。由于无法预先添加到文件中,我有点难过如何做到这一点。Csplit 和 split 似乎没有将其输出附加到现有文件的选项,而且我认为该文件太大,我无法使用文本编辑器对其进行编辑。

我将不胜感激任何建议!

0 投票
1 回答
41 浏览

r - 解析一组值的第一个实例

我在 R 中有一个数据框,如下所示。

我希望将 FRUITSTRING 列拆分为两列,但根据名为 SPLIT_CHAR 的第二列的值逐行拆分。是否有可能做到这一点?注意字符串长度可以改变,分割字符的位置可以改变,这就是为什么我想调用一个特定的字符来进行分割。

我之前使用的函数是 cSplit,但是我不知道如何将此数据帧传递到 cSplit 并使用另一列的阀门作为 csplit 的输入。谢谢

0 投票
0 回答
140 浏览

r - 函数返回错误:矩阵错误(NA_character_,nrow = nrow(indt),ncol = Ncol):无效的“ncol”值(太大或 NA)

我在 R 中构建了一个返回数据框的函数。当我单独执行函数体时,它可以正常工作,但是当我尝试从另一个脚本调用函数时,出现以下错误:

如果检查回溯,我发现以下内容:

所以它似乎发生在cSplit函数内部。

此外,当我在 MacOS 中执行代码时,函数调用正常工作。该问题仅发生在 Windows 环境中。

在 Windows 中使用 R 4.1.1

谢谢!