21

我有一个 If-else 语句,它检查一个字符串以查看是否存在 ISBN-10 或 ISBN-13(图书 ID)。

我面临的问题是 ISBN-10 检查发生在 ISBN-13 检查之前,ISBN-10 检查将匹配 10 个或更多字符的任何内容,因此可能会将 ISBN-13 误认为 ISBN-10。

这是代码...

$str = "ISBN:9780113411436";

if(preg_match("/\d{9}(?:\d|X)/", $str, $matches)){
   echo "ISBN-10 FOUND\n";  
   //isbn returned will be 9780113411
   return 0;
}

else if(preg_match("/\d{12}(?:\d|X)/", $str, $matches)){
   echo "ISBN-13 FOUND\n";
   //isbn returned will be 9780113411436
   return 1;
}

如何确保避免此问题?

4

5 回答 5

41

你真的只需要一个正则表达式。然后进行更有效的strlen()检查以查看哪个匹配。以下将匹配带有或不带有连字符的字符串中的 ISBN-10 和 ISBN-13 值,并且可以选择以字符串ISBN:ISBN:(space)开头ISBN(space)

查找 ISBN:

function findIsbn($str)
{
    $regex = '/\b(?:ISBN(?:: ?| ))?((?:97[89])?\d{9}[\dx])\b/i';

    if (preg_match($regex, str_replace('-', '', $str), $matches)) {
        return (10 === strlen($matches[1]))
            ? 1   // ISBN-10
            : 2;  // ISBN-13
    }
    return false; // No valid ISBN found
}

var_dump(findIsbn('ISBN:0-306-40615-2'));     // return 1
var_dump(findIsbn('0-306-40615-2'));          // return 1
var_dump(findIsbn('ISBN:0306406152'));        // return 1
var_dump(findIsbn('0306406152'));             // return 1
var_dump(findIsbn('ISBN:979-1-090-63607-1')); // return 2
var_dump(findIsbn('979-1-090-63607-1'));      // return 2
var_dump(findIsbn('ISBN:9791090636071'));     // return 2
var_dump(findIsbn('9791090636071'));          // return 2
var_dump(findIsbn('ISBN:97811'));             // return false

这将搜索提供的字符串以查看它是否包含可能的 ISBN-10 值(返回1)或 ISBN-13 值(返回2)。如果没有,它将返回false

参见上面的DEMO


验证 ISBN:

为了严格验证 ISBN 的 Wikipedia文章有一些针对ISBN-10ISBN-13的 PHP 验证函数。以下是复制、整理和修改的示例,以用于上述函数的略微修改版本。

将返回块更改为:

    return (10 === strlen($matches[1]))
        ? isValidIsbn10($matches[1])  // ISBN-10
        : isValidIsbn13($matches[1]); // ISBN-13

验证 ISBN-10:

function isValidIsbn10($isbn)
{
    $check = 0;

    for ($i = 0; $i < 10; $i++) {
        if ('x' === strtolower($isbn[$i])) {
            $check += 10 * (10 - $i);
        } elseif (is_numeric($isbn[$i])) {
            $check += (int)$isbn[$i] * (10 - $i);
        } else {
            return false;
        }
    }

    return (0 === ($check % 11)) ? 1 : false;
}

验证 ISBN-13:

function isValidIsbn13($isbn)
{
    $check = 0;

    for ($i = 0; $i < 13; $i += 2) {
        $check += (int)$isbn[$i];
    }

    for ($i = 1; $i < 12; $i += 2) {
        $check += 3 * $isbn[$i];
    }

    return (0 === ($check % 10)) ? 2 : false;
}

参见上面的DEMO

于 2012-12-31T00:24:25.387 回答
3

使用^and$匹配字符串的开头和结尾。通过使用字符串分隔符,您测试 10 位或 13 位代码的顺序将无关紧要。

10 位数

/^ISBN:(\d{9}(?:\d|X))$/

13 位数

/^ISBN:(\d{12}(?:\d|X))$/

注意:根据http://en.wikipedia.org/wiki/International_Standard_Book_Number,似乎 ISBN 中也可以包含一个-。但根据$str您使用的情况,您似乎在检查 10 位或 13 位数字之前已经删除了连字符。

附加说明:因为 ISBN 的最后一位数字用作前面数字的一种校验和,所以仅正则表达式无法验证ISBN 是否有效。它只能检查 10 或 13 位格式。


$isbns = array(
  'ISBN:1234567890',       // 10-digit
  'ISBN:123456789X',       // 10-digit ending in X
  'ISBN:1234567890123',    // 13-digit
  'ISBN:123456789012X',    // 13-digit ending in X
  'ISBN:1234'              // invalid
);

function get_isbn($str) {
   if (preg_match('/^ISBN:(\d{9}(?:\d|X))$/', $str, $matches)) {
      echo "found 10-digit ISBN\n";
      return $matches[1];
   }
   elseif (preg_match('/^ISBN:(\d{12}(?:\d|X))$/', $str, $matches)) {
      echo "found 13-digit ISBN\n";
      return $matches[1];
   }
   else {
      echo "invalid ISBN\n";
      return null;
   }
}

foreach ($isbns as $str) {
   $isbn = get_isbn($str);
   echo $isbn."\n\n";
}

输出

found 10-digit ISBN
1234567890

found 10-digit ISBN
123456789X

found 13-digit ISBN
1234567890123

found 13-digit ISBN
123456789012X

invalid ISBN
于 2012-12-30T23:32:24.847 回答
1

切换if else块的顺序,同时从您的 ISBN 中删除所有空格、冒号和连字符:

//Replace all the fluff that some companies add to ISBNs
$str = preg_replace('/(\s+|:|-)/', '', $str);

if(preg_match("/^ISBN\d{12}(?:\d|X)$/", $str, $matches)){
   echo "ISBN-13 FOUND\n";
   //isbn returned will be 9780113411436
   return 1;
}

else if(preg_match("/^ISBN\d{9}(?:\d|X)$/", $str, $matches)){
   echo "ISBN-10 FOUND\n";  
   //isbn returned will be 9780113411
   return 0;
}
于 2012-12-30T23:32:58.687 回答
1

将 ISBN-13 检查放在 ISBN-10 检查之前?这是假设您希望将它们作为任何字符串的一部分进行匹配,即(您的示例在开头有一个额外的“ISBN:”,因此匹配字符串中的任何位置似乎是某种要求)

于 2012-12-30T23:32:59.427 回答
0
ISBN10_REGEX = /^(?:\d[\ |-]?){9}[\d|X]$/i
ISBN13_REGEX = /^(?:\d[\ |-]?){13}$/i
于 2016-08-11T07:46:49.540 回答