问题标签 [fastq]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
bash - 动态分配文件名以匹配目录名
这里在“source”目录中有大约 30 个子目录。每个子目录都有某些 .fastq.gz 文件,我想将它们合并到一个 .fastq.gz 文件中,并将合并后的文件保存到目标目录。如您所见,我正在我的程序中动态创建文件。我希望他们的名字与 fastq 文件所在的目录名(本质上是 $f)相匹配。有没有办法动态地为文件分配名称?
perl - 在 Perl 的一个目录中读取相同扩展名的多个文件
我目前在读取一个目录中的文件时遇到问题。我需要将所有 fastq 文件放在一个文件中并为每个文件运行脚本,然后将新文件放在“Edited_sequences”文件夹中。我拥有的一个脚本是
它在一个 fastq 文件中获取前 80000 行,然后输出结果。现在例如我有 2000 个 fastq 文件,然后我需要复制和粘贴 2000 次。我知道这种情况有一个 glob 命令套装,但我只是不知道如何处理。请帮帮我。
multithreading - 如何在我的 bash 脚本中使用并行编程/多线程?
这是我的脚本:
这里在“source”目录中有大约 30 个子目录。每个子目录都有我想合并到一个 R1.fastq.gz 和 R2.fastq.gz 文件中的R1 .fastq.gz 文件和R2 .fastq.gz 文件,然后将合并后的文件保存到目标目录。我的代码运行良好,但由于数据量大,我需要加快速度。我只想知道有什么方法可以在我的脚本中实现多线程编程吗?如何运行我的脚本以使多个作业并行运行?新的 bash 脚本,所以任何帮助将不胜感激。
c++ - QFileDialog “销毁”文件名
现在我正在为一套用于生物信息学的控制台应用程序开发一个 GUI,并且我正在做我的第一个测试,作为我使用 Qt 的第一个项目。我正在使用 QtDesigner 制作 GUI,除了 QFileDialog 将文件名的结尾转换为一个奇怪的字符之外,一切都运行良好,尽管我不确定它是 QFileDialog,还是从QString 转换为const char。
这是我的代码:
fastq-dump程序结束,因为它说文件名不正确,调试后,我看到文件名从/home/nsg/Downloads/SRR502947.sra变成了/home/nsg/Downloads/SRR502947.sra[ ]有时甚至/home/nsg/Downloads/SRR5029[]
任何想法为什么会发生这种情况或如何解决它?
bash - 使用 sed、awk、cut 替换任何以符号 @ 开头的行
这很简单,但我希望有一个快速命令(最好使用 sed、cut、awk 或 BASH 中的其他东西)来执行此操作:
替换任何以符号 @ 开头的行:
和
@
总是一致的,变化<text, on one line, including numbers, letters and colons>
的。(这是面向生物信息学家的 Fastq 格式)。
例子:
改成
我知道这很简单对不起。
linux - 按顺序连接文件 Linux 命令
我刚开始学习使用命令行。希望这不是一个转储问题。
我的目录中有以下文件:
您可以在文件名中看到,它是 R1 和 R2 的混合,并且 L00 之后的数字没有排序。
我想按文件名的顺序连接文件,分别用于 R1 和 R2 文件。
如果我手动执行,它将如下所示:
你能帮我写一个我以后可以重复使用的脚本吗?谢谢!
perl - 在 Perl 中合并具有相同文件名的文件
我目前在 Perl 中合并文件时遇到问题。有两个目录/文件夹,其中包含成对的相同名称和扩展名文件。例如,在文件夹 1 中,我有文件 1.fastq、2.fastq、....、10.fastq。在文件夹 2 中,我有完全相同的文件名 1.fastq、2.fastq、....、10.fastq,但它们包含不同的信息。我想合并具有相同名称的文件,一开始我尝试了 cat 命令
但是,如果文件太多,例如 1000+,我需要做 1000+ 次。如何使用 perl 命令自动执行此操作?
先感谢您。
bash - 使用 sed/awk 命令将 Fastq 转换为 fasta 格式
我有一个 fastq 格式的数据:
我想用“+”分割每个读取使用的 awk 命令,但它不起作用,是否有简单的命令与 see/awk 可以将其转换为 fasta 格式?
预期输出应该是
非常感谢!
perl - Bio Perl:分割成对端数据的代码?
我是生物信息学的初学者,我一直在编写一些 Bio Perl 代码来将配对的末端 MiSeq 数据(当前位于 1 个 fastq 文件中)拆分为 2 个文件,每个文件包含该对的一个末端。配对末端 reads 的不同末端可以通过fastq 标头中空格后的1或2来区分。该文件遵循典型的 fastq 格式,例如在命令行中使用“head”:
我编写了一个代码,试图使用匹配来定位标头中的 1 或 2。虽然我使用 Bio::SeqIO perl 似乎无法识别 fastq 格式,但我不断收到此错误:
有人可以帮我找到/修复我的错误吗?BioPerl 网站提供的信息表明 Bio::SeqIO 应该能够识别 fastq 格式。
这是我写的代码:
感谢您对我的初学者知识的帮助和耐心。
〜铝
问题更新:
我已经修复了我的new
行中的逗号错误,现在我在运行代码时遇到了这个错误:
我所做的所有阅读似乎都表明 BioPerl 本身中的 FASTQ 解析器存在一些问题。我曾希望让这段代码工作,因为我是一个初学者并试图提高我的编程技能(我完全是自学的),这是一个编程对我有实际应用的问题。我同意关于这很慢并且可能不是处理大型 FASTQ 文件的最佳方法的评论。
关于 + 描述符,我的文件是否需要在其他软件程序中使用(例如:CLC)或者我可以通过删除 FASTQ 中的那一行来解决问题?+ 实际上不包含任何读取的质量信息,对吗?
再次感谢您的输入!
python - python字典,使每个奇数行成为键,偶数行成为文件中的值
你好,我有一个这样的文本文件:
我想要的是:
从上面的文件中读取,将第 1,3,5,7 行 ... 设为字典键,将第 2,4,5,8 行 ... 设为字典值。
我的代码是:
该代码有效,但速度很慢,因为我的文本文件的最少行是 200,000 行。有没有人有更好的方法来做到这一点?
非常感谢。
==============添加后续问题==================
这是 fastq 格式,每次读取 4 行(记录):
我想创建一个字典,键是第 1 行,值是每 4 行记录中的第 2 行。
字典看起来像:
谢谢。