我的问题与工作内联 C 代码有关:是否有必要使用内联堆栈函数 (Inline_Stack_Vars) 来传入和传出变量,或者在这种情况下只修改变量是否合适?
为了显示生物序列数据,我只需要显示两个对齐字符串之间的差异;例如给定这两个字符串:
ATCAGAAA--GACATGGGCCAAAGATTAA-CAGTGGCCATTGACAGGA--
--CCCCAACTGACAGGGGGCAAAGATTAA-CAGTGGCCATTG---GGA--
我想得到这个(第二个字符串中的匹配字符替换为'.'s。
--.CCC..CT....G...G..........-............---...--
我有很多序列(数百万次 Illumina 读取),因此已转向 inline::c 进行字符匹配。以下内联代码似乎可以正常工作(将第二个参数更改为 add_matchchars 函数):
#!/usr/bin/perl
use Inline C;
my($seq1,$seq2) = qw/ ATCAGAAA--GACATGGGCCAAAGATTAA-CAGTGGCCATTGACAGGA--
--CCCCAACTGACAGGGGGCAAAGATTAA-CAGTGGCCATTG---GGA-- /;
print $seq1,"\n";
print $seq2,"\n";
add_matchchars($seq1,$seq2);
print $seq2,"\n";
__END__
__C__
void add_matchchars(char *seq1, char *seq2) {
int seq1char;
int seq2char;
while(seq1char = *seq1++ , seq2char = *seq2++) {
if (seq1char == seq2char) {
*seq2--;
if (seq1char != '-') {
*seq2 = '.';
}
*seq2++;
}
//printf("%c-%c\n",seq1char,seq2char);
}
// printf("%s\n%s\n",seq1,seq2);
}
但是1)它是否相当有效(有没有更聪明/更好的方法)?2)它会泄漏内存吗?