问题标签 [csplit]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
logging - 根据日期前缀拆分文件?
我有这个文件.log
我想根据日期分区进行拆分,所以我得到了,
Sep_16.log
Sep_17.log
我在论坛中搜索,它应该是 usingcsplit
和 regex ^.{6}
,但我得到的答案只是将 regex 用作分隔符,这不是我想要的。
另外,我想为每个日期分区拆分 10k 行,因此文件名将类似于
Sep_17_part001.log
,然后将使用诸如前缀和后缀选项之类的东西。
有人知道这样做的完整命令吗?如果我在一个日志上做这一次的事情,我怎样才能让它每天运行,而不用 csplit 覆盖前几天?
r - 如何转换我的数据框以制作行列?
我有一个包含两列“类型”和“统计”的数据框。我希望每种类型都有一行,所有统计信息都在单独的列中。例如,我的数据框看起来像这样:
我希望它看起来像:
并非所有类型都具有相同数量的统计信息,某些类型缺少统计值,而其他类型则有额外的。我尝试使用 t(),但遇到了问题。然后,我尝试将 Stat 的所有值合并到一列并用 and 分隔gsub()
,csplit()
但是我遇到了将每种类型的所有 Stat 值合并到一列的问题。有什么建议吗?
linux - 有没有办法让 split / csplit 在带有换行符的列的 linux 系统上工作?
我在尝试将较大的文件拆分成一堆较小的文件时遇到问题,其中一列中有新行。在我尝试拆分的 CSV 文件中,它的分隔符是管道 (|),每一行由换行符 (\n) 分隔。由于 1 列中有一堆换行符,它可能导致该 CSV 文件看起来像这样:
col1 | col2 | col3| 在这里插入一些东西
这就是意义
新文件
或格式
随机文本
正文 | col5 | col6 | col7
拆分时,它可能会导致我的文档(如果使用按行或字节拆分)仅在 col4 的中间拆分。如果发生这种情况,文件就会被弄乱,我以后无法处理它以将该数据插入我的表中。
我尝试使用 split 和 csplit,但我不确定是否可以根据行 + 分隔符实现良好的拆分。如果我尝试在匹配的地方使用 csplit 正则表达式(| 和换行符),它只会选择这个: text | col5 | col6 | col7 -> 所以不幸的是它也不起作用。
这里的解决方案用完了,也许 split 和 csplit 根本不可能,但我愿意接受建议。谢谢!
unix - 在文件末尾匹配后拆分文件并将匹配保留在文件 unix 中
我有一个包含随机行和关键词END的文件:
我想根据关键字 END 将其拆分为多个文件,并将其放在每个文件中:文件 1
文件 2
我试过了:
linux - 从一个文件创建多个名称与模式匹配的文件
我有一个文本文件,例如:
我想创建多个文本文件,其内容介于每个“--”之间。文本文件将以“>”开头的字符串命名。
最后我会有这些文本文件:
具有以下内容:
Tolten.WP_096573835.1文本文件:
Trivar.WP_011317016.1文本文件:
uniSU2.WP_085434158.1
Chlfri.WP_016876644.1文本文件:
>Noslin.WP_099070767.1文本文件:
我知道 csplit 适用于这种事情:
但我无法正确命名文件。
有谁知道如何提供帮助?
提前致谢 :)
xml - 使用 CSPLIT 的具有多个 Doctype 声明的文件
我有一个包含多个 Doctype 声明的文件。我正在尝试使用 CSPLIT 将文件分成更小的块,但遇到了一些问题。这是我正在使用的文件的示例:
这是我的命令:
以下是错误:
任何解决方案将不胜感激。谢谢!
html - 如何根据 RegEx 模式将文件拆分为多个文件?
我想根据特定的正则表达式模式将一个文件拆分为多个文件。我在下面提供了一个可重现的示例。如果有更简单的解决方案,我也欢迎!
我有一个包含以下文件的目录:
page1.html page2.html page3.html
假设我的 page1.html 看起来像这样:
我想将 page1.html 拆分为:
page1_0.html
page1_1.html
page1_2.html
我想要用以下模式识别行的代码:
[0 to 10 characters in the beginning] , Page (1 [0 to 10 characters here]). </p>
我目前有以下代码:
for filename in *.html; gcsplit -z -f "${filename%.*}_" --suffix-format="%d.html" $filename /'Page (1'/ '{*}'
但这是创建一个 page1_3.html 包含以下文本:
但是当我运行这个时:
这只是输出文件 page1_0.html。
我的正则表达式有什么问题?有没有其他方法可以实现我想要做的事情?
unix - 将大文件一分为二,同时保留标题
我有一个非常大的文本文件(约 1.8TB),需要在某个条目处拆分。我知道这个条目在哪一行,但我也可以通过 grep 命令识别它。从这个条目开始,我只关心文件的一部分。
我看到像 csplit 这样的某些 Unix 命令可以做到这一点。但是,该文件也有一个重要的标题(30 行长),重要的是新创建的文件也包含此标题。由于无法预先添加到文件中,我有点难过如何做到这一点。Csplit 和 split 似乎没有将其输出附加到现有文件的选项,而且我认为该文件太大,我无法使用文本编辑器对其进行编辑。
我将不胜感激任何建议!
r - 解析一组值的第一个实例
我在 R 中有一个数据框,如下所示。
我希望将 FRUITSTRING 列拆分为两列,但根据名为 SPLIT_CHAR 的第二列的值逐行拆分。是否有可能做到这一点?注意字符串长度可以改变,分割字符的位置可以改变,这就是为什么我想调用一个特定的字符来进行分割。
我之前使用的函数是 cSplit,但是我不知道如何将此数据帧传递到 cSplit 并使用另一列的阀门作为 csplit 的输入。谢谢
r - 函数返回错误:矩阵错误(NA_character_,nrow = nrow(indt),ncol = Ncol):无效的“ncol”值(太大或 NA)
我在 R 中构建了一个返回数据框的函数。当我单独执行函数体时,它可以正常工作,但是当我尝试从另一个脚本调用函数时,出现以下错误:
如果检查回溯,我发现以下内容:
所以它似乎发生在cSplit
函数内部。
此外,当我在 MacOS 中执行代码时,函数调用正常工作。该问题仅发生在 Windows 环境中。
在 Windows 中使用 R 4.1.1
谢谢!