2

我有大量数据,如下所示:

 PHHI   GFSX MOS GUIDANCE  10/19/2012  1200 UTC                       
 FHR  24  36| 48  60| 72  84| 96 108|120 132|144 156|168 180|192      
      SAT 20| SUN 21| MON 22| TUE 23| WED 24| THU 25| FRI 26|SAT CLIMO
 N/X  66  80| 68  82| 66  82| 66  81| 66  80| 67  82| 67  81| 67999999
 TMP  69  79| 71  81| 69  80| 69  80| 69  79| 69  80| 70  80| 70      
 DPT  63  64| 66  63| 64  64| 65  64| 65  66| 66  68| 68  65| 66      
 WND  11  10| 10  12| 11   9|  9   8|  8   8|  8   8|  8   7|  7      
 P12   8   9| 11   9| 21  14| 20  10| 18  20| 28  28| 46  15| 32999999
 P24      14|     19|     14|     23|     19|     36|     40|      999
 Q12   0   0|  0   0|  0   0|  0   0|  0   0|  1   1|       |         
 Q24       0|      0|      0|      0|      0|      1|       |         

 PHJH   GFSX MOS GUIDANCE  10/19/2012  1200 UTC                       
 FHR  24  36| 48  60| 72  84| 96 108|120 132|144 156|168 180|192      
      SAT 20| SUN 21| MON 22| TUE 23| WED 24| THU 25| FRI 26|SAT CLIMO
 N/X 999  84|999  84|999  84|999  85|999  84|999  84|999  84|999999999
 TMP 999  83|999  82|999  83|999  83|999  83|999  83|999  83|999      
 ........etc

我需要在 PHP 中对其进行处理,以便可以将其放入 MYSQL 数据库中。

在第一行中,需要第一个单词(电台名称)和日期/时间。根本不需要第二行和第三行。|性格无关紧要。最后两列有问题:

192      
SAT CLIMO
 67999999
 70      
 66      
  7      
 32999999
      999

这些数字相互接触,但实际上它们是 2 个独立的变量。它应该看起来更像这样:

192      
SAT CLIMO
 67 999999
 70      
 66      
  7      
 32 999999
      999

关于如何解析这个的任何提示?是否有任何用于解析固定宽度数据的辅助功能?

4

4 回答 4

3

这是 O'Reilly PHP Cookbook 中回答的经典 PHP 问题。

解析固定宽度分隔的数据

substr工作正常。但是,unpack这是我最喜欢的,因为它在下面使用 C 函数并且速度更快。

于 2014-03-13T20:52:17.750 回答
1

你可以试试

$file = "log.txt";
$list = $part = array();

foreach ( file($file) as $line ) {
    $line = trim($line);
    if (strpos($line, "|") === false) {
        continue;
    }
    $line = explode("|", $line) and $line = end($line);
    $list[] = substr($line, 0, 3) . " " . substr($line, 3);
}
var_dump($list);

输出

array
  0 => string '192 ' (length=4)
  1 => string 'SAT  CLIMO' (length=10)
  2 => string ' 67 999999' (length=10)
  3 => string ' 70 ' (length=4)
  4 => string ' 66 ' (length=4)
  5 => string '  7 ' (length=4)
  6 => string ' 32 999999' (length=10)
  7 => string '       999' (length=10)
  8 => string ' ' (length=1)
  9 => string ' ' (length=1)
  10 => string '192 ' (length=4)
  11 => string 'SAT  CLIMO' (length=10)
  12 => string '999 999999' (length=10)
  13 => string '999 ' (length=4)
于 2012-10-19T17:56:03.503 回答
1

过去我使用 substr() 函数从特定字段获取数据:

http://php.net/manual/en/function.substr.php

例如:

//Index:

012345678

192      
SAT CLIMO
 67999999
 70      
 66      
  7      
 32999999
      999

对于第一列,我会有类似的内容:

while($line = fgets($file)){

    $column1 = substr($line, 0, 3);
    $column2 = substr($line, 3, 6);
}

// for the line 32999999, you get:
// $column1 = 32
// $column2 = 999999

您可以将这些索引设为常量,并且必须先尝试使用它才能通过一些字符计数来使其正确,但这将解决数字一起运行的问题。

于 2012-10-19T17:58:09.700 回答
-1

我会在fscanf这里使用该功能。

于 2012-10-19T17:45:45.280 回答