1

我有一个 HTML 文件,其中只包含文本。没有样式或任何东西。

文本看起来像:

ID     NAME     ANOTHER-ID-11-LETTERS      MAJOR

例子:

20 Paul Mark Zedd 10203040506 Software Engineering

IDANOTHER-ID-11-LETTER是数字.. 是普通文本,NAMEMAJOR包含空格。

如何使用 PHP 剥离它们并在换行符中制作每个单词或每个内容?

预期结果:

20
Paul Mark Zedd
10203040506
Software Engineering
4

2 回答 2

0

只需使用一个

预匹配:

#([\d]*)\s([a-zA-Z\s]*)\s([\d]*)\s([a-zA-Z\s]*)#

示例输出:

array (
  0 => '20 Paul Mark Zedd 10203040506 SoftwareEngineering',
  1 => '20',
  2 => 'Paul Mark Zedd',
  3 => '10203040506',
  4 => 'SoftwareEngineering',
)
于 2013-09-09T14:27:33.307 回答
0

看起来第一项总是一个数字,然后是一个空格,然后是一个可以是任何东西的名称,然后是一个 11 位数字的数字,然后是一些文本。

您可以使用正则表达式和上述详细信息来拆分字符串

$test  = preg_match("/([0-9]*?)\s(.*?)([0-9]{11})\s(.*)/is", "20 Paul Mark Zedd 10203040506 Software Engineering",$matchs);
print_r($matchs)

输出:

Array
(
    [0] => 20 Paul Mark Zedd 10203040506 Software Engineering
    [1] => 20
    [2] => Paul Mark Zedd 
    [3] => 10203040506
    [4] => Software Engineering
)
于 2013-09-09T14:35:07.947 回答