问题标签 [sequencing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
bash - 一起使用 bwa mem 和 umitools
我正在尝试使用 bwa mem 将序列读取与 hg19 参考对齐,但我的序列都有一个 UMI(唯一分子标识符)。我像这样使用umitools:
然后,这将我的 UMI 序列正确地附加到 output.fastq 文件中的名称行,但是当使用 bwa mem 对齐时,我收到以下错误:
有没有办法同时使用 bwa mem 和 umitools 这样就不会发生这种情况?
bash - Using Bash to Manually Edit a Text or Fastq file
I would like to manually edit a Fastq file using Bash to multiple similar lines.
In Fastq files a sequence read starts on line 2 and then is found every fourth line (ie lines 2,6,10,14...).
I would like to create an edited text file that is identical to a Fastq file except the first 6 characters of the sequencing reads are trimmed off.
Unedited Fastq:
Edited Fastq:
sequencing - Galaxy,HTSeq 错误 - 未初始化的值
我对 RNAseq 分析非常陌生。我正在尝试使用 Galaxy 运行 HTSeq,因为我不熟悉编码以及如何使用 Python 执行此操作。
我收到以下错误:
接下来是一长串发现错误的位置。例如:
javascript - Web Audio API - 调度问题
我正在尝试构建一个循环音序器,它利用网络音频 API 和许多不同长度的不同音乐循环。一般的想法是随机选择循环(在一定程度上),然后以特定顺序播放开头、中间和结尾部分。有四个通道 - 贝司、鼓、主音和 FX。就在最后一节结束之前,使用相同的公式选择并播放了一组新样本。
然后我打算添加一个可视化器,也许还有一些自动化 - 即可能为最后几个小节添加混响。
我必须尝试遵循“两个时钟的故事”方法,但由于我对编程和 javascript 还比较陌生,所以我很难实现它。我认为这可能会使事情变得比完成这项工作所需的更复杂。
我最初的想法是创建一个 for 循环,其中的 play 方法指定了我希望循环播放的次数,但我发现这些样本将同时播放。根据“两个时钟的故事”,我尽可能避免使用 setTimeout() 和 setInterval(),因为它只会导致滞后。
我的第二个想法是一次调用所有的播放方法,除了每个都在“歌曲”中的某个点被提示,例如
等等。然而,这导致了它自己的一系列问题,并且似乎是一种相当低效的解决方法。
感觉可能缺少一个明显的解决方案,但经过相当多的研究,我仍然无法解决它。似乎最容易做的事情是让我的 for 循环中的 playSound 函数等待样本完成,然后再次迭代,但这比看起来要困难得多。如果有人能提供任何建议,我将不胜感激,因为我对此束手无策。先感谢您!
//补充一下,我在第二种方法中遇到的问题是,为了实际播放甚至只是开始部分,代码必须看起来像这样才能播放大约 30 秒:
这是一次对 play() 方法的 16 次调用。要播放完整的歌曲,在被重新缓冲并被要求再次播放之前,很可能有 4 个部分。即在加载后立即同时进行至少 16*4 (64) 次调用。我猜想使用光谱仪、自动音频参数和音量/效果滑块,这可能会导致一些问题?谢谢。
//// 这是我的大部分问题都源于的代码示例:
*在第一个示例中,n 被传递给函数,因为中间部分将被提示一次 n = n+2。
*在第二个示例中,我在调用 playLead 时遇到了麻烦,以便每个循环在它结束之前的一个之后开始。相反,该方法一次被调用 4 次。听起来不太好!我在想也许有一种方法可以让 for 循环在收到 playLead 方法的返回之前不会继续,但似乎我错了。
我希望这可以让您对我所处的位置有更多的了解。请询问您是否还希望我包括其他任何内容。感谢一百万的任何帮助!
c# - 在 C# 中生成字母序列的逻辑
顺序应该是这样的。
AZ,AA-AZ,BA-BZ,CA-CZ,.......,ZA-ZZ ZZ之后
应该从AAA开始。
然后AAA到ZZZ,然后AAAA到ZZZZ等等。
这个序列非常类似于 Excel 工作表。
编辑:添加了我的代码
这就是我所做的。但是,我知道这是一个错误的逻辑。
谢谢。
sql - SQL以字母数字ID生成下一个序列
我从这个问题中获得了一些帮助,但仍然需要一些进一步的帮助。
我需要能够生成下一个可用的 2 位字母数字代码。在您询问之前,我无法更改表定义。我在 T-SQL 中工作。
因此,例如,假设我有序列
00, 01, 02,..., 09, 0A, 0B, 0C,..., 0Y, 0Z, 10, 11,...1Y, 1Z, 20, 21,..., 9Y, 9Z, I希望下一个 id 是 A0,
然后是 A1、A2、...、A9、AA、AB、AC、...、AZ,我希望下一个 id 是 B0,然后是 B1,等等。
所以,简而言之,我想从 00 一直到 ZZ,每次都在该字段中查找 MAX 并分配一个大于最大值的新代码 1。我会理解 A > 9,第一列大于第二列,所以 A0 > 99 和 AA > A9。
我希望我可以为所有这些分配一个数字 id,但此时表定义更为关键,所以我不允许更改它,所以我试图最大化我将拥有的可用 id有限的空间。
谢谢您的帮助。
bash - 从 Fastq 文件中提取特定信息以进行测序分析
我的目标是从基因组测序 Fastq 文件中提取数据片段并绘制它们。我想获得每个测序读数的识别信息,然后是关于读数的两条信息。
下面我粘贴了两个从 Fastq 文件读取的内容以供参考,如果有帮助的话。
上面,您可以看到每个读取都以进行读取的染色体编号开始,以及读取在第 1 列和第 2 列中该染色体上的位置。在第 4 列中有参考碱基对,第 5 列包含变体读。然后在第 8 列中还有一堆关于读取的其他信息,其中每个部分用分号分隔。
我在这里关心的两个数字是:RO=
和AO=
。
我想创建一个仅包含 1、2、4、5 列信息的输出文件,然后将 AO/RO 的分数放入最后一列。
作为从第一行开始的输出示例,我想要以下输出:
其中 0.74838 由 RO=39 和 AO=116 计算得出,因此 116/(39+116)=0.74838。并且由 RO=84660 和 AO=120 计算,因此 120/(84660+120)=0.00142
希望这可以澄清我正在寻找的输出。
bash - 将来自 VCF 测序数据的等位基因频率合并在一起
我有一个测序数据文件,其中包含来自基因组的碱基对位置,如下例所示:
我想比较由第 2 列中找到的 bp 位置定义的某些组。然后我想要匹配区域第 5 列中数字的平均值。
因此,使用上面的示例,假设我正在寻找跨越 chr1 810-820 和 chr2 310-330 的所有样本的第 5 列的平均值。前五行应该被识别,它们的第 5 列数应该被平均,等于 0.42。
我尝试创建一个范围数组,然后使用 awk 调用这些位置,但没有成功。提前致谢。
python - ValueError:需要超过 0 个值才能解包(python 列表)
我在编写代码时遇到错误
我在这[index] == []
部分得到了这个错误:
我的问题是,为什么会出现这个错误,我应该如何解决这个问题?
perl - 根据配对长度处理 FASTQ 文件
以下文件是双端 fastq 文件的两个伙伴,我想根据它们的长度分隔每个 fastq。
mate1.fq
:
mate2.fq
:
我编写了以下代码来执行此操作,但仅对第二个文件mate2.fq
(
错误:
Can't use string ("151") as a symbol ref while "strict refs" in use at
如何处理这些文件?