字符串中的模式搜索。
例如。
$string = "111111110000";
FindOut($string);
函数应该返回 0
function FindOut($str){
$items = str_split($str, 3);
print_r($items);
}
字符串中的模式搜索。
例如。
$string = "111111110000";
FindOut($string);
函数应该返回 0
function FindOut($str){
$items = str_split($str, 3);
print_r($items);
}
如果我理解正确,您的问题归结为找出 3 个字符的子字符串是否在字符串中出现两次而没有重叠。如果确实如此,这将为您提供第一次出现的位置:
function findPattern($string, $minlen=3) {
$max = strlen($string)-$minlen;
for($i=0;$i<=$max;$i++) {
$pattern = substr($string,$i,$minlen);
if(substr_count($string,$pattern)>1)
return $i;
}
return false;
}
或者我在这里错过了什么?
您在这里拥有的东西在概念上可以通过滑动窗口来解决。对于您的示例,您有一个大小为 3 的滑动窗口。
对于字符串中的每个字符,您将当前字符的子字符串和接下来的两个字符作为当前模式。然后将窗口向上滑动一个位置,并检查字符串的其余部分是否包含当前模式包含的内容。如果是,则返回当前索引。如果没有,你重复。
例子:
1010101101
|-|
所以,模式 = 101
。现在,我们将滑动窗口推进一个字符:
1010101101
|-|
并查看字符串的其余部分是否有101
,检查 3 个字符的每个组合。
从概念上讲,这应该是解决此问题所需的全部内容。
编辑:我真的不喜欢人们只是要求代码,但由于这似乎是一个有趣的问题,这是我对上述算法的实现,它允许窗口大小变化(而不是固定在 3,该功能仅经过简要测试,省略了明显的错误检查):
function findPattern( $str, $window_size = 3) {
// Start the index at 0 (beginning of the string)
$i = 0;
// while( (the current pattern in the window) is not empty / false)
while( ($current_pattern = substr( $str, $i, $window_size)) != false) {
$possible_matches = array();
// Get the combination of all possible matches from the remainder of the string
for( $j = 0; $j < $window_size; $j++) {
$possible_matches = array_merge( $possible_matches, str_split( substr( $str, $i + 1 + $j), $window_size));
}
// If the current pattern is in the possible matches, we found a duplicate, return the index of the first occurrence
if( in_array( $current_pattern, $possible_matches)) {
return $i;
}
// Otherwise, increment $i and grab a new window
$i++;
}
// No duplicates were found, return -1
return -1;
}
应该注意的是,这当然不是最有效的算法或实现,但它应该有助于澄清问题并给出如何解决问题的简单示例。
看起来您更想使用子字符串函数来走动并检查每三个字符,而不仅仅是将其分成 3 个
function fp($s, $len = 3){
$max = strlen($s) - $len; //borrowed from lafor as it was a terrible oversight by me
$parts = array();
for($i=0; $i < $max; $i++){
$three = substr($s, $i, $len);
if(array_key_exists("$three",$parts)){
return $parts["$three"];
//if we've already seen it before then this is the first duplicate, we can return it
}
else{
$parts["$three"] = i; //save the index of the starting position.
}
}
return false; //if we get this far then we didn't find any duplicate strings
}
这种模式搜索的快速而肮脏的实现:
function findPattern($string){
$matches = 0;
$substrStart = 0;
while($matches < 2 && $substrStart+ 3 < strlen($string) && $pattern = substr($string, $substrStart++, 3)){
$matches = substr_count($string,$pattern);
}
if($matches < 2){
return null;
}
return $substrStart-1;
根据str_split
文档,调用str_split
将"1010101101"
导致:
Array(
[0] => 101
[1] => 010
[2] => 110
[3] => 1
}
这些都不会相互匹配。
您需要查看字符串的每个 3 长切片(从索引 0 开始,然后是索引 1,依此类推)。
我建议查看substr
,您可以像这样使用它:
substr($input_string, $index, $length)
它将为您提供从长度$input_string
开始的部分。$index
$length