-2

字符串中的模式搜索。

例如。

$string = "111111110000";
FindOut($string);

函数应该返回 0

function FindOut($str){    
    $items =  str_split($str, 3);    
    print_r($items);
}
4

5 回答 5

2

如果我理解正确,您的问题归结为找出 3 个字符的子字符串是否在字符串中出现两次而没有重叠。如果确实如此,这将为您提供第一次出现的位置:

function findPattern($string, $minlen=3) {
    $max = strlen($string)-$minlen;
    for($i=0;$i<=$max;$i++) {
        $pattern = substr($string,$i,$minlen);
        if(substr_count($string,$pattern)>1)
            return $i;
    }
    return false;
}

或者我在这里错过了什么?

于 2012-11-12T19:03:13.513 回答
1

您在这里拥有的东西在概念上可以通过滑动窗口来解决。对于您的示例,您有一个大小为 3 的滑动窗口。

对于字符串中的每个字符,您将当前字符的子字符串和接下来的两个字符作为当前模式。然后将窗口向上滑动一个位置,并检查字符串的其余部分是否包含当前模式包含的内容。如果是,则返回当前索引。如果没有,你重复。

例子:

1010101101
|-|

所以,模式 = 101。现在,我们将滑动窗口推进一个字符:

1010101101
 |-|

并查看字符串的其余部分是否有101,检查 3 个字符的每个组合。

从概念上讲,这应该是解决此问题所需的全部内容。

编辑:我真的不喜欢人们只是要求代码,但由于这似乎是一个有趣的问题,这是我对上述算法的实现,它允许窗口大小变化(而不是固定在 3,该功能仅经过简要测试,省略了明显的错误检查):

function findPattern( $str, $window_size = 3) {
    // Start the index at 0 (beginning of the string)
    $i = 0;

    // while( (the current pattern in the window) is not empty / false)
    while( ($current_pattern = substr( $str, $i, $window_size)) != false) {
        $possible_matches = array();

        // Get the combination of all possible matches from the remainder of the string
        for( $j = 0; $j < $window_size; $j++) {
            $possible_matches = array_merge( $possible_matches, str_split( substr( $str, $i + 1 + $j), $window_size));
        }

        // If the current pattern is in the possible matches, we found a duplicate, return the index of the first occurrence
        if( in_array( $current_pattern, $possible_matches)) {
            return $i;
        }

        // Otherwise, increment $i and grab a new window
        $i++;
    }
    // No duplicates were found, return -1
    return -1;
}

应该注意的是,这当然不是最有效的算法或实现,但它应该有助于澄清问题并给出如何解决问题的简单示例。

于 2012-11-12T18:52:49.733 回答
1

看起来您更想使用子字符串函数来走动并检查每三个字符,而不仅仅是将其分成 3 个

function fp($s, $len = 3){
  $max = strlen($s) - $len; //borrowed from lafor as it was a terrible oversight by me
  $parts = array();

  for($i=0; $i < $max; $i++){
    $three = substr($s, $i, $len);
    if(array_key_exists("$three",$parts)){
          return $parts["$three"];  
    //if we've already seen it before then this is the first duplicate, we can return it
    }
    else{
      $parts["$three"] = i; //save the index of the starting position.
    }
  }

  return false; //if we get this far then we didn't find any duplicate strings
}
于 2012-11-12T18:57:39.457 回答
0

这种模式搜索的快速而肮脏的实现:

function findPattern($string){
    $matches = 0;
    $substrStart = 0;

    while($matches < 2 && $substrStart+ 3 < strlen($string) && $pattern = substr($string, $substrStart++, 3)){
        $matches = substr_count($string,$pattern);
    }

    if($matches < 2){
        return null;
    }
    return $substrStart-1;
于 2012-11-12T18:59:23.167 回答
0

根据str_split文档,调用str_split"1010101101"导致:

Array(
  [0] => 101
  [1] => 010
  [2] => 110
  [3] => 1
}

这些都不会相互匹配。

您需要查看字符串的每个 3 长切片(从索引 0 开始,然后是索引 1,依此类推)。

我建议查看substr,您可以像这样使用它:

substr($input_string, $index, $length)

它将为您提供从长度$input_string开始的部分。$index$length

于 2012-11-12T18:53:48.160 回答