0

对于我的项目,我需要分析不同的句子,并通过确定它们是否以问号结尾来确定哪些是问题。

所以我尝试使用explode,但它不支持多个分隔符。我暂时将所有标点符号替换为 chr(1) 以便我可以分解所有句子,无论它们以 (., !, ?, 等等...) 结尾。

然后我需要找到每个句子的最后一个字母,但是爆炸功能已经删除了所有的标点符号,所以我需要一些方法把它放回那里。

我花了很长时间才解决这个问题,但最终我破解了它。我在这里发布我的解决方案,以便其他人可以使用它。

4

2 回答 2

10
$array = preg_split('~([.!?:;])~u',$raw , null, PREG_SPLIT_DELIM_CAPTURE);
于 2013-05-25T11:46:12.877 回答
8

这是我的函数,multipleExplodeKeepDelimiters。以及如何使用它的示例,通过将字符串分解为不同的句子并查看最后一个字符是否是问号:

function multipleExplodeKeepDelimiters($delimiters, $string) {
    $initialArray = explode(chr(1), str_replace($delimiters, chr(1), $string));
    $finalArray = array();
    foreach($initialArray as $item) {
        if(strlen($item) > 0) array_push($finalArray, $item . $string[strpos($string, $item) + strlen($item)]);
    }
    return $finalArray;
}

$punctuation = array(".", ";", ":", "?", "!");
$string = "I am not a question. How was your day? Thank you, very nice. Why are you asking?";

$sentences = multipleExplodeKeepDelimiters($punctuation, $string);
foreach($sentences as $question) {
    if($question[strlen($question)-1] == "?") {
        print("'" . $question . "' is a question<br />");
    }
}
于 2013-05-25T11:41:08.973 回答