3

我有一个关于将 CSV 字符串转换为数组的问题。

INV;165;1;0;1 Username;0;10000;"Here is multiline-text.

with line-breaks:

";20 Offen;0,00
INV;166;1;0;1 Username2;0;10000;"Here is another multiline-text.

with line-breaks:

";20 Offen;0,00

我试图用 str_getcsv 拆分字段,但问题是,分隔符只出现在一个字段中,并且函数也在拆分多行字段。

我的解决方案是首先通过 preg_replace 转换换行符,但我没有进入它。这是我的正则表达式,仅替换由 ;" 和 "; 包围的换行符 :

/(;")(.*)(\n)(.*)(";)/

这种模式实际上只匹配第一个换行符。谁能给我一个提示来做这项工作?

先感谢您。

这是原始 CSV:

CMXINV;165;1;0;1 Felix Hirschberg;0;10000;Herr;;Max;Muster;Company;;Street;123;City;DE;(0 40) 6 25 6;;(0 40) 6 25 6;mail@muster.de;;;;;;;;0;20121217;20121217;1 Sofort ohne Abzug;EUR;1 Agentur;0 ;0,00;;"Vielen Dank für Ihren Auftrag.

Vereinbarungsgemäß berechnen wir Ihnen:

";"Mit besten Grüßen


Invoice Man";;0;0;0;0;;20 Offen;0,00;;0 ;0,00;0,00;;EXW;;;;;;;;;;;;;;;;2;;Project: Test-Project;;0,000;0,00;1,000;0,00;0,00;0;0;0;0;0
CMXINV;165;2;0;1 Felix Hirschberg;0;10000;Herr;;Max;Muster;Company;;Street;123;City;DE;(0 40) 6 25 6;;(0 40) 6 25 6;mail@muster.de;;;;;;;;0;20121217;20121217;1 Sofort ohne Abzug;EUR;1 Agentur;0 ;0,00;;"Vielen Dank für Ihren Auftrag.

Vereinbarungsgemäß berechnen wir Ihnen:

";"Mit besten Grüßen


Invoice Man";;0;0;0;0;;20 Offen;0,00;;0 ;0,00;0,00;;EXW;;;;;;;;;;;;;;;;0;1;"- job1 (1h)
- job2 (1h)
- job3 (0,75h)
- job4 (1h)
- job5 (0,5h)";HR;3,25;100,00;1,00;0,00;325,00;1;0;0;0;0
MESSAGE;S;210053;INVOICE_GET hat 1 Datensätze zurückgegeben
MESSAGE;S;204020;Datenübertragung erfolgreich. Es wurden 1 Datensätze verarbeitet.
4

3 回答 3

2

你可以试试这个:

/;"(([^"]*)([\r\n])+([^"]*))+"/im

这将匹配分隔符内每个换行符前后的文本;"。第二个匹配是前面的文本,第四个匹配是后面的文本。

请注意,我已经省略了最后一个 ';' 以确保如果多行值是行中的最后一个值,这仍然匹配。

于 2012-12-27T14:24:08.713 回答
1

根据 php 手册中的用户评论,fgetcsv()应该str_getcsv()正确处理换行符。

您可能应该利用这些实现(它们应该已经解决了您可能遇到的任何可能的问题)。


编辑:自己的解析器

或者您可以编写自己的解析器(基于评论):

// Browse file one character after another
while (false !== ($c = fgetc($fp))) {
    // We are not inside the value, newline = new row
    if( ($c == "\n") || ($c == "\r")){
       // Newline, add to result
       continue;
    }

    // Whitespace? continue, do nothing
    if( ctype_space( $c)){
        continue;
    }

    // Okay, now we can use switch
    switch( $c){
        case ',':
            // Add empty value
            break;

        // Escaped value
        case '"':
        case "'":
            $escapeChar = $c;
            $prevChar = '';
            $value = '';

            while( false !== ($c = fgetc($fp))){
                // We just hit and end of escaped sequence, check escaped val by \
                if( ($c == $escapeChar) && ($c != '\\') ){
                   break;
                }

                // If we got \ and prev value is \ = "blah blah \\"
                // Prevent escape escape character of being guessed incorrectly
                if( ($c == '\\') && ($prevChar == '\\')){
                    $prevChar = '';
                } else {
                    $prevChar = $c;
                }

                $value .= $c;
            }

            // $value is your value
            break;

        // Normal, non escaped value:
        default:
            $value = '';
            while( false !== ($c = fgetc($fp))){
                if( ($c == ',') || ($c == '\n') || ($c == '\r')){
                    break;
                }
                $value .= $c;
            }

            // $value = your field value
            break;
     }
}
于 2012-12-27T15:48:38.413 回答
0

如果您在文件中有 CSV 输入,则可以使用fgetcsv(),它可以很好地处理多行条目。

如果 CSV 输入在字符串中,您可以使用特殊的php://tempI/O 流将其有效地传递给fgetcsv()

$fp = fopen( 'php://temp', 'w+' );
fputs( $fp, $csv );
rewind( $fp );
$data = fgetcsv( $fp, 0, ';', '"' );
fclose( $fp );
于 2012-12-27T16:38:49.987 回答