5

我提供了一个大写的名字列表。出于在电子邮件中问候的目的,我希望他们使用正确的大小写。

使用 PHP 的ucwords很容易做到。但我觉得我需要一些正则表达式函数来处理常见的异常,例如:

“奥哈拉”、“麦当劳”、“范德斯洛特”等

与其说我需要帮助构建一个正则表达式语句来处理上面的三个示例(那样会很好),不如说我不知道​​所有常见的异常可能是什么。

肯定有人以前遇到过这个问题,任何指向已发布解决方案的指针或您可以分享的东西?

4

3 回答 3

2

在提供的简短列表中使用正则表达式可能很容易,但如果您必须处理数百或数千条记录,则很难做到防弹。

我宁愿使用不会影响别人的东西。你怎么知道“麦克唐纳”先生是否更喜欢“麦克唐纳”?

你在纠正别人的错误。如果源无法更正,您可以使用以下内容:

<?php

$provided_names = array(
  "SMITH",
  "O'HARA",
  "MCDONALD",
  "JONES",
  "VAN DER SLOOT",
  "MACDONALD"
);

$corrected_names = array(
  "O'HARA"        => "O'Hara",
  "MCDONALD"      => "McDonald",
  "VAN DER SLOOT" => "van der Sloot"
);

$email_text = array();

foreach ($provided_names as $provided_name)
{
  $provided_name = !array_key_exists($provided_name, $corrected_names) 
    ? ucwords(strtolower($provided_name)) 
    : $corrected_names[$provided_name];
  $email_text[]  = "{$provided_name}, your message text.";
}

print_r($email_text);

/* output:
Array
(
  [0] => Smith, your message text.
  [1] => O'Hara, your message text.
  [2] => McDonald, your message text.
  [3] => Jones, your message text.
  [4] => van der Sloot, your message text.
  [5] => Macdonald, your message text.
)
*/
?>

我希望它有用。

于 2012-07-17T23:45:25.323 回答
2

我今天写这个是为了在我正在开发的应用程序中实现。我认为这段代码很容易用注释来解释。它并非在所有情况下都 100% 准确,但它可以轻松处理您的大多数西方名字。

例子:

mary-jane => Mary-Jane

o'brien => O'Brien

Joël VON WINTEREGG => Joël von Winteregg

jose de la acosta => Jose de la Acosta

该代码是可扩展的,因为您可以将任何字符串值添加到顶部的数组中以满足您的需要。请研究它并添加任何可能需要的特殊功能。

function name_title_case($str)
{
  // name parts that should be lowercase in most cases
  $ok_to_be_lower = array('av','af','da','dal','de','del','der','di','la','le','van','der','den','vel','von');
  // name parts that should be lower even if at the beginning of a name
  $always_lower   = array('van', 'der');

  // Create an array from the parts of the string passed in
  $parts = explode(" ", mb_strtolower($str));

  foreach ($parts as $part)
  {
    (in_array($part, $ok_to_be_lower)) ? $rules[$part] = 'nocaps' : $rules[$part] = 'caps';
  }

  // Determine the first part in the string
  reset($rules);
  $first_part = key($rules);

  // Loop through and cap-or-dont-cap
  foreach ($rules as $part => $rule)
  {
    if ($rule == 'caps')
    {
      // ucfirst() words and also takes into account apostrophes and hyphens like this:
      // O'brien -> O'Brien || mary-kaye -> Mary-Kaye
      $part = str_replace('- ','-',ucwords(str_replace('-','- ', $part)));
      $c13n[] = str_replace('\' ', '\'', ucwords(str_replace('\'', '\' ', $part)));
    }
    else if ($part == $first_part && !in_array($part, $always_lower))
    {
      // If the first part of the string is ok_to_be_lower, cap it anyway
      $c13n[] = ucfirst($part);
    }
    else
    {
      $c13n[] = $part;
    }
  }

  $titleized = implode(' ', $c13n);

  return trim($titleized);
}
于 2014-02-27T00:18:33.560 回答
2

我为此写了一个小库:https://github.com/tamtamchik/namecase 您可以使用Composer安装它。

对于您的输入,它会使用以下代码准确生成您需要的内容:

<?php

require_once 'vendor/autoload.php'; // Composer autoload

$arr = ["O'HARA", "MCDONALD", "VAN DER SLOOT"];

foreach ($arr as $name) {
    echo $name . ' => ' . str_name_case($name) . PHP_EOL;
}

调用str_name_case任何名称字符串上的库附带的函数,它将转换为正确的大小写。对于您的示例输出将变为:

O'HARA => O'Hara
MCDONALD => McDonald
VAN DER SLOOT => van der Sloot

于 2016-03-22T11:09:14.323 回答