1

我有差异表达(DE)基因的基因序列信息,以及包含在两个数组散列中的转录组序列数据(所有表达的基因)。两个哈希都有一个唯一的基因 ID 作为键(例如“XLOC_000001”)。

我编写了一个程序,它使用来自 DE 基因 HoA 的密钥循环遍历转录组 HoA,从而只给我 DE 基因的基因序列。

HoA 初始化如下:

my %hash;
push @{ $hash{ $firstkey[$_] } }, [ $p_value[$_], $q_value[$_], $log_fold_change[$_] ] for 0 .. $#firstkey;

my %hash2;
push @{ $hash2{ $secondkey[$_] } }, [ $transcriptID[$_], $sequence[$_] ] for 0 .. $#secondkey;

然后我使用第一个散列中的键从第二个散列中提取值(两个散列的键格式相同)

for my $firstkey (sort keys %hash) {
    for my $part (@{ $hash2{$firstkey} }) {
        my ($value3, $value4) = @$part; 
        print $output "$firstkey\n$value4\n";
    }
}

这工作正常。我现在要做的是在输出中包含来自第一个 HoA 的一些附加信息(P/Q 值和有关表达变化水平的信息)。我的问题是:如何在输出中包含来自第一个哈希的值?我理想地想打印出来:

%hash2{$firstkey} => $sequence[$_], $p_value[$_], $q_value[$_], $log_fold_change[$_] 

我很困惑我是否应该将数组的第二个哈希推到第一个(如果是这样的话?!)还是在最后循环遍历两个哈希?

- - - - 更新 - - - - -

每个 HoA 的示例:

第一键:

Key 'XLOC_001155' contains the values: [ TCONS_00001774 Scaffold10052 SEchx 0 SEchxdex 3.51656 inf 0.00345 0.803695 ] 
Key 'XLOC_001173' contains the values: [ TCONS_00001795 Scaffold10222 SEchx 26.3355 SEchxdex 70.1758 1.41397 0.0199 0.998513 ] 
Key 'XLOC_001177' contains the values: [ TCONS_00001799 Scaffold10227 SEchx 26.2873 SEchxdex 0 -inf 0.01285 0.998513 ] 
Key 'XLOC_001195' contains the values: [ TCONS_00001826 Scaffold10227 SEchx 0.0580138 SEchxdex 0.688545 3.56908 0.0398 0.998513 ] 
Key 'XLOC_000001' contains the values: [ TCONS_00000001 Scaffold10262 SEchx 0 SEchxdex 2.01554 inf 0.00615 0.998513 ] 
Key 'XLOC_001290' contains the values: [ TCONS_00001955 Scaffold103603 SEchx 0 SEchxdex 0.732931 inf 0.0139 0.998513 ] 
Key 'XLOC_001308' contains the values: [ TCONS_00001973 Scaffold1001 SEchx 0 SEchxdex 1.11927 inf 0.00295 0.763416 ] 
Key 'XLOC_000002' contains the values: [ TCONS_00000002 Scaffold10052 SEchx 0.0923385 SEchxdex 23.4041 7.98561 0.02025 0.998513 ]

第二键:

Key 'XLOC_000001' contains the values: [ TCONS_00000001 ATTACAATAACTAAGGAGGACATAGCTTAATTTGCACTATTTACTTTAGTGCATCTGTTGTAGTAGGACGTACAAGGACTTTATTGCTTCAGATAAAGACATTTTATTGCTTTCAAGGTATTCCTGAGACAATTGATCGTGCACTGCAAGCTCCACTTCTAAGTATAAACCAGAGGATTGCAAAACTGGAAGCAGTTCTTAGTTTGACTGGACAATTGTATCAAGTAGGAGGAAAAATGTTTGCCACTAATGGGGAGCAAGTTGATTTTGAGGCCTCTAAACTGACCTGTGAAAAGGCTGGTGGACGAATTGCTACTCCAAAGAATGAAGCAGAGAACAATGTTGTGCTAAGTATTTTAAAGAAACACAATAAATATGCATACCTAGGTGTTACAG ] 

Key 'XLOC_000002' contains the values: [ TCONS_00000002 GTCACACGGCCAGCATCACGCGTGTCACGCTTTTATCCGGAATGAGACCAACTCCAACTTTTTGTGACTGACTTATTTTTCTTCTAGTATAAAAAAATGTCTCGCAGCCACGAGAGACTTCAACGCCTATAACCACCGGCGTACCTCAAAACAAGCAGATAATACCGCGCTAAGCAGCGTTCGGGTTTATAGGCGGGCATAGCCTCACTTCCGGCAGGCTGCTAGGAAACCAAAGAGACGCGGATTCTGATGTTTTGAGCTGCGAGGGTGAAGCGACTGCAAGGACAACAATGGATTCTGAATACATAAAGCGCTGTTTAGGGAAGTGTTTGTCCGAAGGACTTGCAGAAGTCGCGGAAAAAAGACCGATGGATCCTATTGAGT ] 

4

2 回答 2

2

要打印键同时出现在%hashand中的所有值%hash2,请使用条件,然后取消引用 arrayrefs。

for my $firstkey (sort keys %hash) {
    if ($hash2{$firstkey}) {
        my @values = (@{ $hash{$firstkey} }, @{ $hash2{$firstkey} });
        #my @values = map @{ $_->{$firstkey} }, \(%hash, %hash2);

        print join("\n", @values), "\n";
    }
}
于 2013-07-03T12:55:34.457 回答
0

我已经解决了:

for my $firstkey (sort keys %hash) {
    for my $part (@{ $hash2{$firstkey} } ) {
        my ($value3, $value4) = @$part;
        print $output "$firstkey ";
        for my $values (@{$hash{$firstkey} } ) {
            my ($value1, $value2) = @$values;
            print $output "$value1, $value2\n";
        }
            print $output "$value4\n";
    }
}
于 2013-07-05T17:17:25.853 回答