“csplit”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

51 浏览

logging - 根据日期前缀拆分文件？

我有这个文件.log

我想根据日期分区进行拆分，所以我得到了，

Sep_16.log

Sep_17.log

我在论坛中搜索，它应该是 usingcsplit和 regex ^.{6}，但我得到的答案只是将 regex 用作分隔符，这不是我想要的。

另外，我想为每个日期分区拆分 10k 行，因此文件名将类似于 Sep_17_part001.log，然后将使用诸如前缀和后缀选项之类的东西。

有人知道这样做的完整命令吗？如果我在一个日志上做这一次的事情，我怎样才能让它每天运行，而不用 csplit 覆盖前几天？

logging csplit

2019-10-16T07:39:28.077

0 投票

1 回答

29 浏览

r - 如何转换我的数据框以制作行列？

我有一个包含两列“类型”和“统计”的数据框。我希望每种类型都有一行，所有统计信息都在单独的列中。例如，我的数据框看起来像这样：

我希望它看起来像：

并非所有类型都具有相同数量的统计信息，某些类型缺少统计值，而其他类型则有额外的。我尝试使用 t()，但遇到了问题。然后，我尝试将 Stat 的所有值合并到一列并用 and 分隔gsub()，csplit()但是我遇到了将每种类型的所有 Stat 值合并到一列的问题。有什么建议吗？

r dataframe rows transpose csplit

2020-02-12T16:29:59.020

0 投票

0 回答

105 浏览

linux - 有没有办法让 split / csplit 在带有换行符的列的 linux 系统上工作？

我在尝试将较大的文件拆分成一堆较小的文件时遇到问题，其中一列中有新行。在我尝试拆分的 CSV 文件中，它的分隔符是管道 (|)，每一行由换行符 (\n) 分隔。由于 1 列中有一堆换行符，它可能导致该 CSV 文件看起来像这样：

col1 | col2 | col3| 在这里插入一些东西

这就是意义

新文件

或格式

随机文本

正文 | col5 | col6 | col7

拆分时，它可能会导致我的文档（如果使用按行或字节拆分）仅在 col4 的中间拆分。如果发生这种情况，文件就会被弄乱，我以后无法处理它以将该数据插入我的表中。

我尝试使用 split 和 csplit，但我不确定是否可以根据行 + 分隔符实现良好的拆分。如果我尝试在匹配的地方使用 csplit 正则表达式（| 和换行符），它只会选择这个： text | col5 | col6 | col7 -> 所以不幸的是它也不起作用。

这里的解决方案用完了，也许 split 和 csplit 根本不可能，但我愿意接受建议。谢谢！

linux csv unix split csplit

2020-04-16T07:22:54.690

0 投票

2 回答

54 浏览

unix - 在文件末尾匹配后拆分文件并将匹配保留在文件 unix 中

我有一个包含随机行和关键词END的文件：

我想根据关键字 END 将其拆分为多个文件，并将其放在每个文件中：文件 1

文件 2

我试过了：

unix awk split csplit

2020-06-22T14:39:53.490

0 投票

1 回答

106 浏览

linux - 从一个文件创建多个名称与模式匹配的文件

我有一个文本文件，例如：

我想创建多个文本文件，其内容介于每个“--”之间。文本文件将以“>”开头的字符串命名。

最后我会有这些文本文件：

具有以下内容：

Tolten.WP_096573835.1文本文件：

Trivar.WP_011317016.1文本文件：

uniSU2.WP_085434158.1

Chlfri.WP_016876644.1文本文件：

>Noslin.WP_099070767.1文本文件：

我知道 csplit 适用于这种事情：

但我无法正确命名文件。

有谁知道如何提供帮助？

提前致谢：）

linux command-line csplit

2020-08-19T09:47:56.580

0 投票

0 回答

22 浏览

xml - 使用 CSPLIT 的具有多个 Doctype 声明的文件

我有一个包含多个 Doctype 声明的文件。我正在尝试使用 CSPLIT 将文件分成更小的块，但遇到了一些问题。这是我正在使用的文件的示例：

这是我的命令：

以下是错误：

任何解决方案将不胜感激。谢谢！

xml command-line csplit

2020-11-11T15:16:18.290

0 投票

2 回答

68 浏览

html - 如何根据 RegEx 模式将文件拆分为多个文件？

我想根据特定的正则表达式模式将一个文件拆分为多个文件。我在下面提供了一个可重现的示例。如果有更简单的解决方案，我也欢迎！

我有一个包含以下文件的目录：

page1.html page2.html page3.html

假设我的 page1.html 看起来像这样：

我想将 page1.html 拆分为：

page1_0.html

page1_1.html

page1_2.html

我想要用以下模式识别行的代码：

[0 to 10 characters in the beginning] , Page (1 [0 to 10 characters here]). </p>

我目前有以下代码：

for filename in *.html; gcsplit -z -f "${filename%.*}_" --suffix-format="%d.html" $filename /'Page (1'/ '{*}'

但这是创建一个 page1_3.html 包含以下文本：

但是当我运行这个时：

这只是输出文件 page1_0.html。

我的正则表达式有什么问题？有没有其他方法可以实现我想要做的事情？

html regex zsh csplit

2020-12-16T03:25:57.453

0 投票

1 回答

98 浏览

unix - 将大文件一分为二，同时保留标题

我有一个非常大的文本文件（约 1.8TB），需要在某个条目处拆分。我知道这个条目在哪一行，但我也可以通过 grep 命令识别它。从这个条目开始，我只关心文件的一部分。

我看到像 csplit 这样的某些 Unix 命令可以做到这一点。但是，该文件也有一个重要的标题（30 行长），重要的是新创建的文件也包含此标题。由于无法预先添加到文件中，我有点难过如何做到这一点。Csplit 和 split 似乎没有将其输出附加到现有文件的选项，而且我认为该文件太大，我无法使用文本编辑器对其进行编辑。

我将不胜感激任何建议！

unix split grep csplit

2021-05-24T10:52:28.480

0 投票

1 回答

41 浏览

r - 解析一组值的第一个实例

我在 R 中有一个数据框，如下所示。

我希望将 FRUITSTRING 列拆分为两列，但根据名为 SPLIT_CHAR 的第二列的值逐行拆分。是否有可能做到这一点？注意字符串长度可以改变，分割字符的位置可以改变，这就是为什么我想调用一个特定的字符来进行分割。

我之前使用的函数是 cSplit，但是我不知道如何将此数据帧传递到 cSplit 并使用另一列的阀门作为 csplit 的输入。谢谢

r parsing csplit

2021-07-27T11:36:21.057

0 投票

0 回答

140 浏览

r - 函数返回错误：矩阵错误（NA_character_，nrow = nrow（indt），ncol = Ncol）：无效的“ncol”值（太大或 NA）

我在 R 中构建了一个返回数据框的函数。当我单独执行函数体时，它可以正常工作，但是当我尝试从另一个脚本调用函数时，出现以下错误：

如果检查回溯，我发现以下内容：

所以它似乎发生在cSplit函数内部。

此外，当我在 MacOS 中执行代码时，函数调用正常工作。该问题仅发生在 Windows 环境中。

在 Windows 中使用 R 4.1.1

谢谢！

r function matrix csplit

2021-08-12T08:13:41.470

问题标签 [csplit]

Reference