问题标签 [fasta]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何在 FASTA 序列中找到反向重复模式?
假设我的长序列看起来像:
这个长序列中的两个斜体子序列(这里是两颗星内)一起称为反向重复模式。这两个子序列中四个字母(如 A、T、G、C)的长度和组合会有所不同。但这两个子序列之间存在关系。请注意,当您考虑第一个子序列时,它的互补子序列是 ACTGGA(根据 A 与 T 结合,G 与 C 结合),当您反转此互补子序列(即最后一个字母在前)时,它与第二个子序列匹配。
FASTA 序列中存在大量此类模式(包含 1000 万个 ATGC 字母),我想找到此类模式及其开始和结束位置。
arrays - 我无法访问哈希值
我有一个程序可以在解析 FASTA 文件时创建一个哈希数组。这是我的代码
我的问题是当线路
打印 $arrayOfHashes[0]{id};
被调用,我收到一条错误消息
在 fasta_tie.pl 第 47 行第 6670 行的打印中使用未初始化的值。
你会在上面的代码中看到我注释掉了一行,上面写着
推(@arrayOfHashes,“$i”);
因为我想确保哈希有效。此外,数据以所需的格式正确打印。看起来像这样
HLA:HLA00127:A*74:01:2918
python - 如何计算fasta格式文件中的氨基酸?
我找到了解析 fasta frmated 文件的代码。我需要计算每个序列中有多少个A、T、G等,例如:
在这个序列中:
代码非常简单:
但是我怎样才能计算那些氨基酸呢?我不想使用 BioPython,我想知道如何使用,例如count
...
java - 下载 Fasta 文件并将其写入文本文件
我正在使用此代码从 pdb 网站下载 fasta 序列文件。pdb id 是字符串 protid。
我没有收到错误,但写入的文件为 0 字节。我尝试从同一个站点下载另一个不同格式的文件,没有任何问题。
python - 在列表中的多个元素上重复一个函数
我写了这段代码
它生成一个看起来像这样的列表 -
['TAAAACACCC', 'TCAATTCAAG', 'GGTTTTTGAG', 'CGAGCTTTTT', 'ACTCAAAGAA', 'TCCAAGATAG', 'CGTTTAAAAA', 'TTTAGGGGTG', 'TTAGGCTCAG', 'CATAGAGTTT']
现在下一步是读取列表中每个元素中字母GC
(或 can be )的出现次数。CG
有没有办法以输出文件看起来像这样的方式遍历列表:
由于文件太大,而且'TAAGATATA'
我将获得的段数(列表中的每个单独元素,如在输出文件中。另外,由于我是 python(和编程)的新手,所以我不太擅长使用函数。
java - 从 JAVA 文件中提取特定数据
这是存储在文本文件中的数据。我如何去严格地提取数据之间
当只有
我们都知道。
此外,在这个给定的示例中,虽然要检索的数据只有一行,但它也可以变化到多行。到目前为止,我尝试将文件的全部内容写入字符串变量并使用子字符串,但由于最终索引未知,该逻辑似乎存在缺陷。请帮忙
导入java.io.*;公共类 ReadingChainSpecificFastaSequence {
python - 将molfile转换为fasta
我正在从事生物信息学项目。
我想使用 python 将 MDL 文件(molfile - .mol)转换为 FASTA 文件。
谁能告诉我我该怎么做?
mol 文件结构:http
://en.wikipedia.org/wiki/Chemical_table_file#Molfile
fasta 文件结构:http ://en.wikipedia.org/wiki/FASTA_format
python - 正则表达式删除直到特定字符的新行
我在格式的文件中有一系列字符串:
我正在尝试找到一个正则表达式模式,它将删除>
下一个字符之间的字符下方的换行符>
。所以最终结果看起来像:
有谁知道我怎么能想出一个正则表达式模式来做到这一点?
旁注:这种格式作为 FASTA 格式在计算科学中很常见。
谢谢!
python - 从文件中编译由某个元素分隔的行。Python
文件:
我正在构建一个读取具有这种格式的文件的函数。该格式中嵌入了多个文件,由'>'+名称分隔(例如'>1','>2')
我正在尝试获取'>'行两侧的文本行并将它们编译成每个部分的一个字符串
所以这看起来像
我不知道该怎么做 else: 语句我尝试用 range(0,len(lines)) 创建一个索引,所以也许我可以在它找到 '>' 的地方做一些事情,并为以下索引编译所有行,直到它找到下一个 '>' 并将它们添加到名为 seq_list 的列表中
任何帮助将不胜感激
perl - 是什么导致了这些错误?
$Xentr4
在第 6 行的 Convert1.pl 的连接 (.) 或字符串中使用未初始化的值
我收到以下错误:
在 Convert1.pl 第 6 行打开没有这样的文件或目录时出错"