0

我想根据字符位值(用户指定)将字符串转换为其对应的位向量。我正在处理基因组字符串,其中我只有 4 个字符,即 A、G、C、T。我想用java中的以下位值来表示它们

A = 01
G = 11
C = 10
T = 00

现在给定一个字符串“AGGT”,那么它对应的位值应该是 01111100。我尝试过如下操作:

 BitSet A = new BitSet(2);
 BitSet G = new BitSet(2);
 BitSet C = new BitSet(2);
 BitSet T = new BitSet(2);
 A.set(01);
 G.set(00);
 C.set(11);
 T.set(10);

String p = "AGGT";
BitSet bb = new BitSet();
for(int i = 0, n = p.length() ; i < n ; i++) { 
   bb.set(p.charAt(i))      
}

我究竟做错了什么?如何以正确的方式做到这一点。?

4

1 回答 1

0

正如@Thomas 所指出的,BitSet.set(int)它不像您显然期望的那样工作。

public void set(int bitIndex)

将指定索引处的位设置为真。

所以:G.set(00)不设置Gto的两位:它设置to0的第二位(在位置 1)。Gtrue

但是您不使用最初创建的位集:如果您A在字符串中遇到 an ,您实际上是在将第 66 位(位置 65)设置为true,因为 65 是 char 文字的整数值'A'


最简单的方法就是在循环中进行切换:

Bitset bb = new BitSet(2 * p.length());
for (int i = 0; i < p.length(); ++i) {
  switch (p.charAt(i)) {
    case 'A':
      bb.set(2*i + 0, false);
      bb.set(2*i + 1, true);
      break;
    case 'G':
      bb.set(2*i + 0, false);
      bb.set(2*i + 1, false);
      break;
    // etc.
  }
}

(没有必要将这些位设置为false;但这只是更明确一点)。

于 2016-07-21T09:16:34.963 回答