0

我有一个表示数据库表的复杂字符串。而且我需要单独提取该数据库表来处理它们。

这是字符串示例:

First table
    | | {{Категория}} | | {{Стоимость курсов}} | {{Стоимость учебного набора}} |
    | 1 | Взрослый | 1 уровень = 50ч  | 1~500 лей | 15 евро |
    | 2 |   Студент, Мастерант, Докторант | 1 уровень = 50ч | 1~000 лей | 15 евро |
    | 3 | Ученик | 1 уровень = 50ч  | 1~000 лей | 15 евро |
    | 4 | Пенсионер | 1 уровень = 50ч  | 1~000 лей | 15 евро |
text text  text text text text
    Second table:
        | | {{Вид курсов}} | | {{Стоимость курсов}}| {{Стоимость учебного набора}} |
        | 1 | dfgdfgdfg | 1 модуль | 500 лей |  0 |
        |^|^| 2 модуля | 900 лей | 0 |
        |^|^| 4 модуля | 1~500 лей | 0 |
        | 2 | fgdfgdfg | 12ч | 800 лей | 0 |
        | 3 | dfgdfgdfgdfg| 12ч | 900 лей | 0 |
        |^|^| Предварительный тест | 400 лей | 0 |
text text text text text text

我尝试使用这个正则表达式:\|.+preg_match_all()只是转储数组中所有未分隔的表。请问有什么帮助吗?谢谢。

4

3 回答 3

1

如我所见,您在一个字符串中有一组表。而且您需要将字符串拆分为表格。我假设您可以将字符串与文本分开,分隔表格。

<?php
$s = <<<EOSTR
First table
    | | {{Категория}} | | {{Стоимость курсов}} | {{Стоимость учебного набора}} |
    | 1 | Взрослый | 1 уровень = 50ч  | 1~500 лей | 15 евро |
    | 2 |   Студент, Мастерант, Докторант | 1 уровень = 50ч | 1~000 лей | 15 евро |
    | 3 | Ученик | 1 уровень = 50ч  | 1~000 лей | 15 евро |
    | 4 | Пенсионер | 1 уровень = 50ч  | 1~000 лей | 15 евро |
text text  text text text text
    Second table:
        | | {{Вид курсов}} | | {{Стоимость курсов}}| {{Стоимость учебного набора}} |
        | 1 | dfgdfgdfg | 1 модуль | 500 лей |  0 |
        |^|^| 2 модуля | 900 лей | 0 |
        |^|^| 4 модуля | 1~500 лей | 0 |
        | 2 | fgdfgdfg | 12ч | 800 лей | 0 |
        | 3 | dfgdfgdfgdfg| 12ч | 900 лей | 0 |
        |^|^| Предварительный тест | 400 лей | 0 |
text text text text text text
EOSTR;

$a = null;
$a = preg_split('/^(?:.(?<!\|))*$/xm', $s);
var_dump($a);

就像这里: http: //ideone.com/VCt4f(使用这个问题)。这会给你这个:

array(5) {
  [0]=>
  string(0) ""
  [1]=>
  string(506) "
    | | {{Категория}} | | {{Стоимость курсов}} | {{Стоимость учебного набора}} |
    | 1 | Взрослый | 1 уровень = 50ч  | 1~500 лей | 15 евро |
    | 2 |   Студент, Мастерант, Докторант | 1 уровень = 50ч | 1~000 лей | 15 евро |
    | 3 | Ученик | 1 уровень = 50ч  | 1~000 лей | 15 евро |
    | 4 | Пенсионер | 1 уровень = 50ч  | 1~000 лей | 15 евро |
"
  [2]=>
  string(1) "
"
  [3]=>
  string(466) "
        | | {{Вид курсов}} | | {{Стоимость курсов}}| {{Стоимость учебного набора}} |
        | 1 | dfgdfgdfg | 1 модуль | 500 лей |  0 |
        |^|^| 2 модуля | 900 лей | 0 |
        |^|^| 4 модуля | 1~500 лей | 0 |
        | 2 | fgdfgdfg | 12ч | 800 лей | 0 |
        | 3 | dfgdfgdfgdfg| 12ч | 900 лей | 0 |
        |^|^| Предварительный тест | 400 лей | 0 |
"
  [4]=>
  string(0) ""
}

完成提取表后,您可以简单地将它们拆分为列

// $a = preg_split...

foreach ($a as $table) {
    if (!strlen(trim($table)))
         continue;

    $rows = preg_split('/\n/', $table);

    foreach ($rows as $row) {
        if (!strlen(trim($row)))
            continue;

        $columns = preg_split('/\|/', $row);

        // work with $columns array
    }
}
于 2012-05-08T14:01:29.997 回答
0

您可以尝试在“|”上使用explode()函数 和“”(空格)并以这种方式解析它。除此之外,我真的想不出任何其他方式。

$exploded = explode("|", $table);
$exploded = explode(" ", $table);
于 2012-05-08T13:32:53.990 回答
0

只需将正则表达式与两次爆炸和一次迭代交换就更简单、更快捷

$table = array();
$rows = explode("\n", $string);

foreach($rows as $row)
    $table[] = explode("|", $row);

现在我们有了一个二维数组结构,这样我们就可以很容易地以表格的形式回显出来,就像这样

echo "<table>";
foreach($table as $row) {
    echo "<tr>";

    foreach($row as $column)
        echo "<td>$column</td>";

    echo "</tr>";
}
echo "</table>";
于 2012-05-08T13:44:05.887 回答