我有一个使用 numpy 矩阵的矩阵:
>>> print matrix
[['L' 'G' 'T' 'G' 'A' 'P' 'V' 'I']
['A' 'A' 'S' 'G' 'P' 'S' 'S' 'G']
['A' 'A' 'S' 'G' 'P' 'S' 'S' 'G']
['G' 'L' 'T' 'G' 'A' 'P' 'V' 'I']]
我想要的是对于每对可能的列,从每对列中的行中检索每对字母的唯一出现次数的频率。
例如,对于第一对列,即:
[['L' 'G']
['A' 'A']
['A' 'A']
['G' 'L']]
我想检索列中每对字母的频率(注意:字母的顺序很重要)
['L' 'G'] 的频率 = 1/4
['A' 'A'] 的频率 = 2/4
['G' 'L'] 的频率 = 1/4
一旦计算了第一对列的这些频率,然后对每个其他可能的列对组合执行相同的操作。
我认为某种 itertools 将有助于解决这个问题,但我不知道如何......任何帮助将不胜感激