3

我想用压缩技术而不是 Huffman 和 Adaptive Huffman 算法来压缩 DNA 序列,我使用 c# 作为编程语言。任何人都可以引导我找到一个算法。注意:我想要无损压缩

4

1 回答 1

6

使用 DNA 序列,您有 4 种可能的状态,即

  • 鸟嘌呤 (G, 00 )
  • 胞嘧啶 (C, 01 )
  • 腺嘌呤 (A, 10 )
  • 胸腺嘧啶 (T, 11 )

您可以使用两位来存储这四种可能的状态以及括号中的值。使用这个简单的方法,您将能够在一个字节中存储四个不同的值。


更新
正如@kol 提到的那样,您实际上可以使用任何压缩算法来进一步缩小数据。目前 .NET 附带两种压缩方法(Deflate 和 GZip),更多可以在SharpZipLib开源库中找到

于 2011-12-19T18:16:56.463 回答