0

我是python的新手,开始学习它。

我想制作一个脚本来计算文本文件中相同的字母模式。问题是我的文本文件有多行。当他们转到下一行时,我找不到我的一些模式。

我的文件和图案是 DNA 序列。

例子:

'attctcgatcagtctctctagtgtgtgagagactctagctagatcgtccactcactgac**ga 
tc**agtcagt**gatc**tctcctactacaaggtgacatgagtgtaaattagtgtgagtgagtgaa'

我正在寻找'gatc'。第二个被计算了,但第一个没有。

那么,如何将此文件制作为单行文本文件?

4

3 回答 3

1
dnatext = text.replace('\n', '')    // join text lines
gatc_count = dnatext.count('gatc')  // count 'gatc' occurrences 
于 2012-06-05T10:45:16.223 回答
1

当您从文件中读取模式时,您可以加入这些行:

    fd = open('dna.txt', 'r')
    dnatext = ''.join(fd.readlines())
    dnatext.count('gatc')
于 2012-06-05T10:36:08.760 回答
0

这应该可以解决问题:

dnatext = "".join(dnatext.split("\n"))
于 2012-06-05T10:04:20.163 回答