0

我有一个使用简并核苷酸序列的 15 聚体核苷酸基序。示例:ATTNTTRTCNGGHGCN。

我会搜索一组序列以查找该主题的出现。但是,我的其他序列是精确序列,即它们没有歧义。

我尝试for在序列中进行循环来搜索它,但我无法进行非精确搜索。我使用的代码仿照Biopython 食谱上的代码。

for pos,seq in m.instances.search(test_seq):
    print pos, seq

我想搜索所有可能的非精确 15-mer 的精确实例。是否有可用的功能,或者我是否必须为此定义自己的功能?(我可以做后者,只是想在继续之前与世界再次确认我没有重复别人的努力 - 我已经浏览了我认为是文档的相关部分。)

4

1 回答 1

3

使用 Biopython 的nt_search. 它在 DNA 序列中寻找一个子序列,将歧义代码扩展到该位置的可能核苷酸。例子:

>>> from Bio import SeqUtils
>>> pat = "ATNTTRTCNGGHGCN"
>>> SeqUtils.nt_search("CCCCCCCATCTTGTCAGGCGCTCCCCCC", pat)
['AT[GATC]TT[AG]TC[GATC]GG[ACT]GC[GATC]', 7]

它返回一个列表,其中第一项是搜索模式,然后是匹配项的位置。

于 2013-08-29T23:09:20.977 回答