问题标签 [fasta]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

804 问题

0 投票

4 回答

2306 浏览

python - 如何在 FASTA 序列中找到反向重复模式？

假设我的长序列看起来像：

这个长序列中的两个斜体子序列（这里是两颗星内）一起称为反向重复模式。这两个子序列中四个字母（如 A、T、G、C）的长度和组合会有所不同。但这两个子序列之间存在关系。请注意，当您考虑第一个子序列时，它的互补子序列是 ACTGGA（根据 A 与 T 结合，G 与 C 结合），当您反转此互补子序列（即最后一个字母在前）时，它与第二个子序列匹配。

FASTA 序列中存在大量此类模式（包含 1000 万个 ATGC 字母），我想找到此类模式及其开始和结束位置。

python fasta

2013-01-12T21:27:10.757

0 投票

2 回答

105 浏览

arrays - 我无法访问哈希值

我有一个程序可以在解析 FASTA 文件时创建一个哈希数组。这是我的代码

我的问题是当线路

打印 $arrayOfHashes[0]{id};

被调用，我收到一条错误消息

在 fasta_tie.pl 第 47 行第 6670 行的打印中使用未初始化的值。

你会在上面的代码中看到我注释掉了一行，上面写着

推（@arrayOfHashes，“$i”）；

因为我想确保哈希有效。此外，数据以所需的格式正确打印。看起来像这样

HLA:HLA00127：A*74:01：2918

2013-01-15T21:24:30.157

0 投票

4 回答

5634 浏览

python - 如何计算fasta格式文件中的氨基酸？

我找到了解析 fasta frmated 文件的代码。我需要计算每个序列中有多少个A、T、G等，例如：

在这个序列中：

代码非常简单：

但是我怎样才能计算那些氨基酸呢？我不想使用 BioPython，我想知道如何使用，例如count...

python bioinformatics biopython fasta

2013-01-18T10:59:34.260

0 投票

3 回答

572 浏览

java - 下载 Fasta 文件并将其写入文本文件

我正在使用此代码从 pdb 网站下载 fasta 序列文件。pdb id 是字符串 protid。

我没有收到错误，但写入的文件为 0 字节。我尝试从同一个站点下载另一个不同格式的文件，没有任何问题。

java file-io pdb fasta

2013-01-21T16:11:48.700

0 投票

2 回答

137 浏览

python - 在列表中的多个元素上重复一个函数

我写了这段代码

它生成一个看起来像这样的列表 -

['TAAAACACCC', 'TCAATTCAAG', 'GGTTTTTGAG', 'CGAGCTTTTT', 'ACTCAAAGAA', 'TCCAAGATAG', 'CGTTTAAAAA', 'TTTAGGGGTG', 'TTAGGCTCAG', 'CATAGAGTTT']

现在下一步是读取列表中每个元素中字母GC（或 can be ）的出现次数。CG有没有办法以输出文件看起来像这样的方式遍历列表：

由于文件太大，而且'TAAGATATA'我将获得的段数（列表中的每个单独元素，如在输出文件中。另外，由于我是 python（和编程）的新手，所以我不太擅长使用函数。

python fasta dna-sequence

2013-01-22T17:24:12.303

0 投票

2 回答

1907 浏览

java - 从 JAVA 文件中提取特定数据

这是存储在文本文件中的数据。我如何去严格地提取数据之间

当只有

我们都知道。

此外，在这个给定的示例中，虽然要检索的数据只有一行，但它也可以变化到多行。到目前为止，我尝试将文件的全部内容写入字符串变量并使用子字符串，但由于最终索引未知，该逻辑似乎存在缺陷。请帮忙

导入java.io.*；公共类 ReadingChainSpecificFastaSequence {

java fasta

2013-01-22T17:52:16.657

0 投票

1 回答

372 浏览

python - 将molfile转换为fasta

我正在从事生物信息学项目。

我想使用 python 将 MDL 文件（molfile - .mol）转换为 FASTA 文件。

谁能告诉我我该怎么做？

mol 文件结构：http
://en.wikipedia.org/wiki/Chemical_table_file#Molfile fasta 文件结构：http ://en.wikipedia.org/wiki/FASTA_format

python bioinformatics fasta

2013-02-07T05:27:17.590

0 投票

5 回答

175 浏览

python - 正则表达式删除直到特定字符的新行

我在格式的文件中有一系列字符串：

我正在尝试找到一个正则表达式模式，它将删除>下一个字符之间的字符下方的换行符>。所以最终结果看起来像：

有谁知道我怎么能想出一个正则表达式模式来做到这一点？

旁注：这种格式作为 FASTA 格式在计算科学中很常见。

谢谢！

python regex fasta

2013-02-10T18:18:55.340

0 投票

2 回答

62 浏览

python - 从文件中编译由某个元素分隔的行。Python

文件：

我正在构建一个读取具有这种格式的文件的函数。该格式中嵌入了多个文件，由'>'+名称分隔（例如'>1'，'>2'）

我正在尝试获取'>'行两侧的文本行并将它们编译成每个部分的一个字符串

所以这看起来像

我不知道该怎么做 else: 语句我尝试用 range(0,len(lines)) 创建一个索引，所以也许我可以在它找到 '>' 的地方做一些事情，并为以下索引编译所有行，直到它找到下一个 '>' 并将它们添加到名为 seq_list 的列表中

任何帮助将不胜感激

python function indexing line fasta

2013-02-12T20:42:30.910

0 投票

2 回答

75 浏览

perl - 是什么导致了这些错误？

$Xentr4在第 6 行的 Convert1.pl 的连接 (.) 或字符串中使用未初始化的值

我收到以下错误：

在 Convert1.pl 第 6 行打开没有这样的文件或目录时出错"

perl initialization fasta

2013-02-17T18:41:17.980

1 2 3 4 5 6 7 8 9 10

问题标签 [fasta]

Reference