0

我正在尝试使用此功能检查希腊语中的两个句子:

   private function process_line_three($target_line_three,$case_line_three){
      $target_line_three=trim($target_line_three);
       $case_line_three=trim($case_line_three);
      echo "<br/><br/>";
       var_dump($case_line_three);
        echo "<br/><br/>";
        echo mb_detect_encoding($target_line_three);
        echo "<br/><br/>";
         echo mb_detect_encoding($case_line_three);
       //$this->print_chars_not_equal($target_line_three,$case_line_three);

   return strcasecmp($target_line_three, $case_line_three)==0;
   }

当我将以下两个字符串传递给他们时,我得到了这个:

Line 3: case Συνδέσου με χιλιάδες ανθρώπους Παρακολούθησε & δράσε ζωντανά 24/7==Συνδέσου με χιλιάδες ανθρώπους Παρακολούθησε & δράσε ζωντανά 24/7

但是平等在这里失败了..我对该结果返回错误,即使两个句子都相似..为什么会这样?

更新 :

var_dump($case_line_three); string(117) "Συνδέσου με χιλιάδες ανθρώπους Παρακολούθησε & δράσε ζωντανά 24/7"

同时,我正在尝试查找编码问题

更新2: 输出是:

string(117) "Συνδέσου με χιλιάδες ανθρώπους Παρακολούθησε & δράσε ζωντανά 24/7" 

UTF-8

UTF-8

两个字符都是 utf

当我写入文件时更新 3输出:

Συνδέσου με χιλιάδες ανθρώπους Παρακολούθησε &amp; δράσε ζωντανά 24/7

Συνδέσου με χιλιάδες ανθρώπους Παρακολούθησε & δράσε ζωντανά 24/7
4

4 回答 4

2

你可以试试:

if(strcmp ($target1 , $target2 ) == 0);

第二种选择是使用多字节编码不敏感比较....

function mb_strcasecmp($target1, $target2, $encoding = null) {
    if (null === $encoding) { $encoding = mb_internal_encoding(); }
    return strcmp(mb_strtoupper($target1, $encoding), mb_strtoupper($target2, $encoding)); }
于 2012-06-13T09:10:32.767 回答
1

尝试使用 PHP 本机方法strcasecmp()- http://php.net/strcasecmp

于 2012-06-13T09:10:13.960 回答
1

您可以使用strncmp字符来比较两个字符串,当它们不相等时停止。然后您可以确定哪些字符不同。levenshtein可能会告诉你有多少个字符不同。

$a = 'Συνδέσου με χιλιάδες ανθρώπους Παρακολούθησε & δράσε ζωντανά 24/7';
$b = 'Συνδέσου με χιλιάδες ανθρώπους Παρακολούθησε & δράσε ζωντανά 24/7';

$i=1; $l=strlen($a); $equals=true;
while ($i<=$l && $equals) {
    if (strncmp($a, $b, $i) != 0) {
        $equals = false;
    } else {
        $i++;
    }
}
if ($equals) {
    echo 'Strings are equal';
} else {
    echo 'Character '.$i.' is not equal';
}

字符串对我来说是相等的,所以这可能是一个编码问题。您可以使用mb-detect-encoding检查违规字符的编码http://www.php.net/manual/en/function.mb-detect-encoding.php

于 2012-06-13T09:15:42.797 回答
-2

会不会是编码问题?

尝试使用这个:

return (strcmp($target_line_three, $case_line_three) == 0);

strcmp()是区分大小写的。如果不区分大小写,请使用strcasecmp()

于 2012-06-13T09:17:15.237 回答