问题标签 [fasta]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
2306 浏览

python - 如何在 FASTA 序列中找到反向重复模式?

假设我的长序列看起来像:

这个长序列中的两个斜体子序列(这里是两颗星内)一起称为反向重复模式。这两个子序列中四个字母(如 A、T、G、C)的长度和组合会有所不同。但这两个子序列之间存在关系。请注意,当您考虑第一个子序列时,它的互补子序列是 ACTGGA(根据 A 与 T 结合,G 与 C 结合),当您反转此互补子序列(即最后一个字母在前)时,它与第二个子序列匹配。

FASTA 序列中存在大量此类模式(包含 1000 万个 ATGC 字母),我想找到此类模式及其开始和结束位置。

0 投票
2 回答
105 浏览

arrays - 我无法访问哈希值

我有一个程序可以在解析 FASTA 文件时创建一个哈希数组。这是我的代码

我的问题是当线路

打印 $arrayOfHashes[0]{id};

被调用,我收到一条错误消息

在 fasta_tie.pl 第 47 行第 6670 行的打印中使用未初始化的值。

你会在上面的代码中看到我注释掉了一行,上面写着

推(@arrayOfHashes,“$i”);

因为我想确保哈希有效。此外,数据以所需的格式正确打印。看起来像这样

HLA:HLA00127:A*74:01:2918

0 投票
4 回答
5634 浏览

python - 如何计算fasta格式文件中的氨基酸?

我找到了解析 fasta frmated 文件的代码。我需要计算每个序列中有多少个A、T、G等,例如:

在这个序列中:

代码非常简单:

但是我怎样才能计算那些氨基酸呢?我不想使用 BioPython,我想知道如何使用,例如count...

0 投票
3 回答
572 浏览

java - 下载 Fasta 文件并将其写入文本文件

我正在使用此代码从 pdb 网站下载 fasta 序列文件。pdb id 是字符串 protid。

我没有收到错误,但写入的文件为 0 字节。我尝试从同一个站点下载另一个不同格式的文件,没有任何问题。

0 投票
2 回答
137 浏览

python - 在列表中的多个元素上重复一个函数

我写了这段代码

它生成一个看起来像这样的列表 -

['TAAAACACCC', 'TCAATTCAAG', 'GGTTTTTGAG', 'CGAGCTTTTT', 'ACTCAAAGAA', 'TCCAAGATAG', 'CGTTTAAAAA', 'TTTAGGGGTG', 'TTAGGCTCAG', 'CATAGAGTTT']

现在下一步是读取列表中每个元素中字母GC(或 can be )的出现次数。CG有没有办法以输出文件看起来像这样的方式遍历列表:

由于文件太大,而且'TAAGATATA'我将获得的段数(列表中的每个单独元素,如在输出文件中。另外,由于我是 python(和编程)的新手,所以我不太擅长使用函数。

0 投票
2 回答
1907 浏览

java - 从 JAVA 文件中提取特定数据

这是存储在文本文件中的数据。我如何去严格地提取数据之间

当只有

我们都知道。

此外,在这个给定的示例中,虽然要检索的数据只有一行,但它也可以变化到多行。到目前为止,我尝试将文件的全部内容写入字符串变量并使用子字符串,但由于最终索引未知,该逻辑似乎存在缺陷。请帮忙

导入java.io.*;公共类 ReadingChainSpecificFastaSequence {

0 投票
1 回答
372 浏览

python - 将molfile转换为fasta

我正在从事生物信息学项目。

我想使用 python 将 MDL 文件(molfile - .mol)转换为 FASTA 文件。

谁能告诉我我该怎么做?

mol 文件结构:http
://en.wikipedia.org/wiki/Chemical_table_file#Molfile fasta 文件结构:http ://en.wikipedia.org/wiki/FASTA_format

0 投票
5 回答
175 浏览

python - 正则表达式删除直到特定字符的新行

我在格式的文件中有一系列字符串:

我正在尝试找到一个正则表达式模式,它将删除>下一个字符之间的字符下方的换行符>。所以最终结果看起来像:

有谁知道我怎么能想出一个正则表达式模式来做到这一点?

旁注:这种格式作为 FASTA 格式在计算科学中很常见。

谢谢!

0 投票
2 回答
62 浏览

python - 从文件中编译由某个元素分隔的行。Python

文件:

我正在构建一个读取具有这种格式的文件的函数。该格式中嵌入了多个文件,由'>'+名称分隔(例如'>1','>2')

我正在尝试获取'>'行两侧的文本行并将它们编译成每个部分的一个字符串

所以这看起来像

我不知道该怎么做 else: 语句我尝试用 range(0,len(lines)) 创建一个索引,所以也许我可以在它找到 '>' 的地方做一些事情,并为以下索引编译所有行,直到它找到下一个 '>' 并将它们添加到名为 seq_list 的列表中

任何帮助将不胜感激

0 投票
2 回答
75 浏览

perl - 是什么导致了这些错误?

$Xentr4在第 6 行的 Convert1.pl 的连接 (.) 或字符串中使用未初始化的值

我收到以下错误:

在 Convert1.pl 第 6 行打开没有这样的文件或目录时出错"