1

我喜欢使用 Perl 从外部 Perl 脚本中捕获所有全局变量。目前我在类型检测周围徘徊。

如何确定正确的数据类型(''、'SCALAR'、'HASH'、'ARRAY'、'CODE')?

解析器脚本:

my %allVariables = ();
{
     do "scriptToBeParsed.pl";
     foreach my $sym ( keys %main:: ) {
         # Get all normal variables and scalar/hash/array references:
        if ( ref( *{"$sym"} ) =~ m/^(?:|SCALAR|HASH|ARRAY)$/ ) {
            $allVariables{"$sym"} = *{"$sym"};
        }
    }
}

要解析的脚本:

$someVariable1 = 'Yes, I like to be captured';
$otherVariable2 = \'And I also want to be captured';
%anotherVariable3 = ( 'Capture' => 'me' );
@lameVariable4 = ( 'Capture', 'me' );
$fooVariable5 = { 'Capture' => 'me' };
$barVariable6 = [ 'Capture', 'me' ];
$subVariable7 = sub { return "Don't capture me!" };
sub dontCaptureMe { return "Don't capture me!" }

在我的示例ref( *{"$sym"} )中,总是返回“GLOB”(当然)。

4

2 回答 2

3

另一种方法是使用 typeglob 的类似 has 的访问,这在 brian d foy 的Mastering Perl第 131f 页的第 8 章中进行了解释。

package test;
no strict;
no warnings; 

$someVariable1 = 'Yes, I like to be captured';
$otherVariable2 = \'And I also want to be captured';
%anotherVariable3 = ( 'Capture' => 'me' );
@lameVariable4 = ( 'Capture', 'me' );
$fooVariable5 = { 'Capture' => 'me' };
$barVariable6 = [ 'Capture', 'me' ];
$subVariable7 = sub { return "Don't capture me!" };
sub dontCaptureMe { return "Don't capture me!" }

say $dontCaptureMe;
my %allVariables = ();
{
  do "scriptToBecomeParsed.pl";
  foreach my $sym ( keys %test:: ) {
    for (qw( SCALAR HASH ARRAY CODE IO)) {
      if (*{"$sym"}{$_}) {
        $allVariables{$_}->{"$sym"} = *{"$sym"}{$_};
      }
    }
  }
}

print Data::Dumper::Dumper \%allVariables;

这将产生以下输出:

$VAR1 = {
          'CODE' => {
                      'dontCaptureMe' => sub { "DUMMY" }
                    },
          'ARRAY' => {
                       'lameVariable4' => [
                                            'Capture',
                                            'me'
                                          ]
                     },
          'HASH' => {
                      'anotherVariable3' => {
                                              'Capture' => 'me'
                                            }
                    },
          'SCALAR' => {
                        'someVariable1' => \'Yes, I like to be captured',
                        '__ANON__' => \undef,
                        'subVariable7' => \sub { "DUMMY" },
                        'dontCaptureMe' => \undef,
                        'otherVariable2' => \\'And I also want to be captured',
                        'BEGIN' => \undef,
                        'barVariable6' => \[
                                              'Capture',
                                              'me'
                                            ],
                        'anotherVariable3' => \undef,
                        'lameVariable4' => \undef,
                        'fooVariable5' => \{
                                              'Capture' => 'me'
                                            }
                      }
        };
于 2012-08-06T15:05:30.080 回答
1

就像你所说

ref( *{"$sym"} ) 总是返回 'GLOB' (当然)。

因为 perl 将符号表中的所有内容都存储在一个 glob 中,所以无法分辨某物是哪种数据类型。这是因为在 perl 中,具有相同名称的数组、标量、散列或任何其他内容是完全有效的……因此,perl 将所有内容存储在 glob 中以避免冲突。您可以做的是遍历符号表中的所有符号,并针对所有可能的事物(集合不太大)测试每个 glob,然后查看设置了哪些符号。

或者,一种更实用的方法可能是将 perl 脚本作为文本加载并解析$, %, @, sub, open(filehandle) 以查看所有内容的类型。

于 2012-08-06T14:48:37.737 回答