问题标签 [fastq]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
129 浏览

bash - 动态分配文件名以匹配目录名

这里在“source”目录中有大约 30 个子目录。每个子目录都有某些 .fastq.gz 文件,我想将它们合并到一个 .fastq.gz 文件中,并将合并后的文件保存到目标目录。如您所见,我正在我的程序中动态创建文件。我希望他们的名字与 fastq 文件所在的目录名(本质上是 $f)相匹配。有没有办法动态地为文件分配名称?

0 投票
3 回答
825 浏览

perl - 在 Perl 的一个目录中读取相同扩展名的多个文件

我目前在读取一个目录中的文件时遇到问题。我需要将所有 fastq 文件放在一个文件中并为每个文件运行脚本,然后将新文件放在“Edited_sequences”文件夹中。我拥有的一个脚本是

它在一个 fastq 文件中获取前 80000 行,然后输出结果。现在例如我有 2000 个 fastq 文件,然后我需要复制和粘贴 2000 次。我知道这种情况有一个 glob 命令套装,但我只是不知道如何处理。请帮帮我。

0 投票
2 回答
17353 浏览

multithreading - 如何在我的 bash 脚本中使用并行编程/多线程?

这是我的脚本:

这里在“source”目录中有大约 30 个子目录。每个子目录都有我想合并到一个 R1.fastq.gz 和 R2.fastq.gz 文件中的R1 .fastq.gz 文件和R2 .fastq.gz 文件,然后将合并后的文件保存到目标目录。我的代码运行良好,但由于数据量大,我需要加快速度。我只想知道有什么方法可以在我的脚本中实现多线程编程吗?如何运行我的脚本以使多个作业并行运行?新的 bash 脚本,所以任何帮助将不胜感激。

0 投票
2 回答
111 浏览

c++ - QFileDialog “销毁”文件名

现在我正在为一套用于生物信息学的控制台应用程序开发一个 GUI,并且我正在做我的第一个测试,作为我使用 Qt 的第一个项目。我正在使用 QtDesigner 制作 GUI,除了 QFileDialog 将文件名的结尾转换为一个奇怪的字符之外,一切都运行良好,尽管我不确定它是 QFileDialog,还是从QString 转换为const char

这是我的代码:

fastq-dump程序结束,因为它说文件名不正确,调试后,我看到文件名从/home/nsg/Downloads/SRR502947.sra变成了/home/nsg/Downloads/SRR502947.sra[ ]有时甚至/home/nsg/Downloads/SRR5029[]

任何想法为什么会发生这种情况或如何解决它?

0 投票
2 回答
4862 浏览

bash - 使用 sed、awk、cut 替换任何以符号 @ 开头的行

这很简单,但我希望有一个快速命令(最好使用 sed、cut、awk 或 BASH 中的其他东西)来执行此操作:

替换任何以符号 @ 开头的行:

@总是一致的,变化<text, on one line, including numbers, letters and colons>的。(这是面向生物信息学家的 Fastq 格式)。

例子:

改成

我知道这很简单对不起。

0 投票
2 回答
6858 浏览

linux - 按顺序连接文件 Linux 命令

我刚开始学习使用命令行。希望这不是一个转储问题。

我的目录中有以下文件:

您可以在文件名中看到,它是 R1 和 R2 的混合,并且 L00 之后的数字没有排序。

我想按文件名的顺序连接文件,分别用于 R1 和 R2 文件。

如果我手动执行,它将如下所示:

你能帮我写一个我以后可以重复使用的脚本吗?谢谢!

0 投票
1 回答
689 浏览

perl - 在 Perl 中合并具有相同文件名的文件

我目前在 Perl 中合并文件时遇到问题。有两个目录/文件夹,其中包含成对的相同名称和扩展名文件。例如,在文件夹 1 中,我有文件 1.fastq、2.fastq、....、10.fastq。在文件夹 2 中,我有完全相同的文件名 1.fastq、2.fastq、....、10.fastq,但它们包含不同的信息。我想合并具有相同名称的文件,一开始我尝试了 cat 命令

但是,如果文件太多,例如 1000+,我需要做 1000+ 次。如何使用 perl 命令自动执行此操作?

先感谢您。

0 投票
2 回答
454 浏览

bash - 使用 sed/awk 命令将 Fastq 转换为 fasta 格式

我有一个 fastq 格式的数据:

我想用“+”分割每个读取使用的 awk 命令,但它不起作用,是否有简单的命令与 see/awk 可以将其转换为 fasta 格式?

预期输出应该是

非常感谢!

0 投票
3 回答
1136 浏览

perl - Bio Perl:分割成对端数据的代码?

我是生物信息学的初学者,我一直在编写一些 Bio Perl 代码来将配对的末端 MiSeq 数据(当前位于 1 个 fastq 文件中)拆分为 2 个文件,每个文件包含该对的一个末端。配对末端 reads 的不同末端可以通过fastq 标头中空格后的12来区分。该文件遵循典型的 fastq 格式,例如在命令行中使用“head”:

我编写了一个代码,试图使用匹配来定位标头中的 1 或 2。虽然我使用 Bio::SeqIO perl 似乎无法识别 fastq 格式,但我不断收到此错误:

有人可以帮我找到/修复我的错误吗?BioPerl 网站提供的信息表明 Bio::SeqIO 应该能够识别 fastq 格式。

这是我写的代码:

感谢您对我的初学者知识的帮助和耐心。

〜铝

问题更新:

我已经修复了我的new行中的逗号错误,现在我在运行代码时遇到了这个错误:

我所做的所有阅读似乎都表明 BioPerl 本身中的 FASTQ 解析器存在一些问题。我曾希望让这段代码工作,因为我是一个初学者并试图提高我的编程技能(我完全是自学的),这是一个编程对我有实际应用的问题。我同意关于这很慢并且可能不是处理大型 FASTQ 文件的最佳方法的评论。

关于 + 描述符,我的文件是否需要在其他软件程序中使用(例如:CLC)或者我可以通过删除 FASTQ 中的那一行来解决问题?+ 实际上不包含任何读取的质量信息,对吗?

再次感谢您的输入!

0 投票
4 回答
1295 浏览

python - python字典,使每个奇数行成为键,偶数行成为文件中的值

你好,我有一个这样的文本文件:

我想要的是:

从上面的文件中读取,将第 1,3,5,7 行 ... 设为字典键,将第 2,4,5,8 行 ... 设为字典值。

我的代码是:

该代码有效,但速度很慢,因为我的文本文件的最少行是 200,000 行。有没有人有更好的方法来做到这一点?

非常感谢。

==============添加后续问题==================

这是 fastq 格式,每次读取 4 行(记录):

我想创建一个字典,键是第 1 行,值是每 4 行记录中的第 2 行。

字典看起来像:

谢谢。