“fastq”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

129 浏览

bash - 动态分配文件名以匹配目录名

这里在“source”目录中有大约 30 个子目录。每个子目录都有某些 .fastq.gz 文件，我想将它们合并到一个 .fastq.gz 文件中，并将合并后的文件保存到目标目录。如您所见，我正在我的程序中动态创建文件。我希望他们的名字与 fastq 文件所在的目录名（本质上是 $f）相匹配。有没有办法动态地为文件分配名称？

bash fastq

2013-08-21T19:13:38.633

0 投票

3 回答

825 浏览

perl - 在 Perl 的一个目录中读取相同扩展名的多个文件

我目前在读取一个目录中的文件时遇到问题。我需要将所有 fastq 文件放在一个文件中并为每个文件运行脚本，然后将新文件放在“Edited_sequences”文件夹中。我拥有的一个脚本是

它在一个 fastq 文件中获取前 80000 行，然后输出结果。现在例如我有 2000 个 fastq 文件，然后我需要复制和粘贴 2000 次。我知道这种情况有一个 glob 命令套装，但我只是不知道如何处理。请帮帮我。

2013-08-21T21:26:55.523

0 投票

2 回答

17353 浏览

multithreading - 如何在我的 bash 脚本中使用并行编程/多线程？

这是我的脚本：

这里在“source”目录中有大约 30 个子目录。每个子目录都有我想合并到一个 R1.fastq.gz 和 R2.fastq.gz 文件中的R1 .fastq.gz 文件和R2 .fastq.gz 文件，然后将合并后的文件保存到目标目录。我的代码运行良好，但由于数据量大，我需要加快速度。我只想知道有什么方法可以在我的脚本中实现多线程编程吗？如何运行我的脚本以使多个作业并行运行？新的 bash 脚本，所以任何帮助将不胜感激。

multithreading bash parallel-processing fastq

2013-08-22T15:17:10.087

0 投票

2 回答

111 浏览

c++ - QFileDialog “销毁”文件名

现在我正在为一套用于生物信息学的控制台应用程序开发一个 GUI，并且我正在做我的第一个测试，作为我使用 Qt 的第一个项目。我正在使用 QtDesigner 制作 GUI，除了 QFileDialog 将文件名的结尾转换为一个奇怪的字符之外，一切都运行良好，尽管我不确定它是 QFileDialog，还是从QString 转换为const char。

这是我的代码：

fastq-dump程序结束，因为它说文件名不正确，调试后，我看到文件名从/home/nsg/Downloads/SRR502947.sra变成了/home/nsg/Downloads/SRR502947.sra[ ]有时甚至/home/nsg/Downloads/SRR5029[]

任何想法为什么会发生这种情况或如何解决它？

c++qt bioinformatics fastq

2013-09-03T16:19:25.107

0 投票

2 回答

4862 浏览

bash - 使用 sed、awk、cut 替换任何以符号 @ 开头的行

这很简单，但我希望有一个快速命令（最好使用 sed、cut、awk 或 BASH 中的其他东西）来执行此操作：

替换任何以符号 @ 开头的行：

和

@总是一致的，变化<text, on one line, including numbers, letters and colons>的。（这是面向生物信息学家的 Fastq 格式）。

例子：

改成

我知道这很简单对不起。

bash awk sed cut fastq

2013-09-30T23:03:18.030

0 投票

2 回答

6858 浏览

linux - 按顺序连接文件 Linux 命令

我刚开始学习使用命令行。希望这不是一个转储问题。

我的目录中有以下文件：

您可以在文件名中看到，它是 R1 和 R2 的混合，并且 L00 之后的数字没有排序。

我想按文件名的顺序连接文件，分别用于 R1 和 R2 文件。

如果我手动执行，它将如下所示：

你能帮我写一个我以后可以重复使用的脚本吗？谢谢！

linux sorting cat fastq

2013-10-15T18:37:06.813

0 投票

1 回答

689 浏览

perl - 在 Perl 中合并具有相同文件名的文件

我目前在 Perl 中合并文件时遇到问题。有两个目录/文件夹，其中包含成对的相同名称和扩展名文件。例如，在文件夹 1 中，我有文件 1.fastq、2.fastq、....、10.fastq。在文件夹 2 中，我有完全相同的文件名 1.fastq、2.fastq、....、10.fastq，但它们包含不同的信息。我想合并具有相同名称的文件，一开始我尝试了 cat 命令

但是，如果文件太多，例如 1000+，我需要做 1000+ 次。如何使用 perl 命令自动执行此操作？

先感谢您。

perl file-io fastq

2013-10-22T23:45:58.453

0 投票

2 回答

454 浏览

bash - 使用 sed/awk 命令将 Fastq 转换为 fasta 格式

我有一个 fastq 格式的数据：

我想用“+”分割每个读取使用的 awk 命令，但它不起作用，是否有简单的命令与 see/awk 可以将其转换为 fasta 格式？

预期输出应该是

非常感谢！

bash awk sed fastq

2013-10-23T00:35:20.873

0 投票

3 回答

1136 浏览

perl - Bio Perl：分割成对端数据的代码？

我是生物信息学的初学者，我一直在编写一些 Bio Perl 代码来将配对的末端 MiSeq 数据（当前位于 1 个 fastq 文件中）拆分为 2 个文件，每个文件包含该对的一个末端。配对末端 reads 的不同末端可以通过fastq 标头中空格后的1或2来区分。该文件遵循典型的 fastq 格式，例如在命令行中使用“head”：

我编写了一个代码，试图使用匹配来定位标头中的 1 或 2。虽然我使用 Bio::SeqIO perl 似乎无法识别 fastq 格式，但我不断收到此错误：

有人可以帮我找到/修复我的错误吗？BioPerl 网站提供的信息表明 Bio::SeqIO 应该能够识别 fastq 格式。

这是我写的代码：

感谢您对我的初学者知识的帮助和耐心。

〜铝

问题更新：

我已经修复了我的new行中的逗号错误，现在我在运行代码时遇到了这个错误：

我所做的所有阅读似乎都表明 BioPerl 本身中的 FASTQ 解析器存在一些问题。我曾希望让这段代码工作，因为我是一个初学者并试图提高我的编程技能（我完全是自学的），这是一个编程对我有实际应用的问题。我同意关于这很慢并且可能不是处理大型 FASTQ 文件的最佳方法的评论。

关于 + 描述符，我的文件是否需要在其他软件程序中使用（例如：CLC）或者我可以通过删除 FASTQ 中的那一行来解决问题？+ 实际上不包含任何读取的质量信息，对吗？

再次感谢您的输入！

perl bioinformatics bioperl fastq

2013-12-04T17:02:28.457

0 投票

4 回答

1295 浏览

python - python字典，使每个奇数行成为键，偶数行成为文件中的值

你好，我有一个这样的文本文件：

我想要的是：

从上面的文件中读取，将第 1,3,5,7 行 ... 设为字典键，将第 2,4,5,8 行 ... 设为字典值。

我的代码是：

该代码有效，但速度很慢，因为我的文本文件的最少行是 200,000 行。有没有人有更好的方法来做到这一点？

非常感谢。

==============添加后续问题==================

这是 fastq 格式，每次读取 4 行（记录）：

我想创建一个字典，键是第 1 行，值是每 4 行记录中的第 2 行。

字典看起来像：

谢谢。

python dictionary fasta fastq

2014-01-05T18:09:58.023

问题标签 [fastq]

Reference