10

给定一个字符串,我想要一个包含单词的字符串数组,每个字符串前面都有任何非单词字符。

示例输入字符串:

one "two" (three) -four-

字符串中的单词可以是任何东西,甚至是乱码,带有任意数量的标点符号或符号。

我想看到的:

大批:
一
 “二
“ (三
) -四
-

本质上,对于每场比赛,最后一件事是一个单词,前面是前一场比赛留下的任何东西。

我将在 PHP 中使用它。我尝试了 preg_match_all() 和 preg_split() 的各种组合,其中的模式包含许多“\w”、“\b”、“[^\w]”等变体。

更大的图景

如何在字符串中的每个单词后放置 * 以进行搜索?

4

4 回答 4

10

如果您只想在每个“单词”之后添加一个星号,您可以这样做:

<?php
$test = 'one "two" (three) -four-';

echo preg_replace('/(\w+)/', "$1*", $test);
?>

http://phpfiddle.org/main/code/8nr-bpb

于 2013-02-18T17:53:24.820 回答
7

您可以使用负前瞻来拆分单词边界,如下所示:

$array = preg_split( '/(?!\w)\b/', 'one "two" (three) -four-');

Aprint_r( $array); 为您提供所需的确切输出:

大批
(
    [0] => 一
    [1] =>“两个
    [2] => "(三个
    [3] => ) -四
    [4] => -
)
于 2013-02-18T17:50:09.253 回答
0

这是一个如何在 PHP 中使用正则表达式查找单词的示例。

<?php
    $subject = "abcdef";
    $pattern = '/^def/';
    preg_match($pattern, substr($subject, 3), $matches, PREG_OFFSET_CAPTURE);
    print_r($matches);
?>
于 2013-02-18T17:52:54.050 回答
0

替代

[^\w]*(\b\w*\b)?
----- ----------
 |        |
 |        |-> Matches a word 0 or 1 time
 |-> Matches 0 to many characters except [a-zA-Z0-9_]

你需要匹配!

于 2013-02-18T18:00:00.450 回答