1

我有一个 fastq 文件(基因组序列)文件夹和一个带有条形码(20 个核苷酸系列)的 excel 文件,我想搜索所有 fastq 文件中的所有条形码并获得精确匹配。我单独为几个条形码进行了“zgrep -u 条形码文件 1 文件 2 文件 3”测试,它可以工作,但现在我想创建一个脚本来为我做这件事,因为我有大约 200 个不同的条形码要在 10 个文件中查找。我不确定如何将 zgrep 合并到这样的脚本中。

4

1 回答 1

0

您好,欢迎来到堆栈溢出。很抱歉,这里的某些人阅读了您的非 IT 背景,并且肯定会为您神秘地回答。

关于你的问题:

首先,如果可能,请使用以下 PowerShell 命令在您的计算机上安装 ImportExcel 模块:

Install-Module -Name ImportExcel -Scope CurrentUser -Force

之后,我们可以运行这个小脚本来为 Excel 文档中的每一行执行 zgrep:

# Change this to the path to your file
$FilePath = "C:\Test123.xlsx"

$excelContent = Import-Excel -Path $FilePath
foreach($row in $excelContent)
{
    # Change columnName to the Name of the columne the barcodes are in
    zgrep -u $row.columnName file1 file2 file3
}

这应该是您解决问题所需的全部内容。

于 2021-06-16T09:22:06.143 回答