php - 如何将 PascalCase 转换为 snake_case？

Question

如果我有：

$string = "PascalCase";

我需要

"pascal_case"

PHP 是否为此目的提供函数？

score 183 · Accepted Answer

更短的解决方案：类似于编辑器的简化正则表达式并修复“尾随下划线”问题：

$output = strtolower(preg_replace('/(?<!^)[A-Z]/', '_$0', $input));

PHP 演示| 正则表达式演示

请注意，类似的情况SimpleXML将转换为simple_x_m_l使用上述解决方案。这也可以被认为是驼峰式表示法的错误使用（正确的是SimpleXml）而不是算法的错误，因为这种情况总是模棱两可的——即使通过将大写字符分组到一个字符串（simple_xml）这种算法在其他边缘情况下总是会失败喜欢XMLHTMLConverter或靠近缩写的单字母词等。如果您不介意（相当罕见的）边缘情况并希望SimpleXML正确处理，您可以使用更复杂的解决方案：

$output = ltrim(strtolower(preg_replace('/[A-Z]([A-Z](?![a-z]))*/', '_$0', $input)), '_');

PHP 演示| 正则表达式演示

score 173 · Accepted Answer

试穿这个尺寸：

$tests = array(
  'simpleTest' => 'simple_test',
  'easy' => 'easy',
  'HTML' => 'html',
  'simpleXML' => 'simple_xml',
  'PDFLoad' => 'pdf_load',
  'startMIDDLELast' => 'start_middle_last',
  'AString' => 'a_string',
  'Some4Numbers234' => 'some4_numbers234',
  'TEST123String' => 'test123_string',
);

foreach ($tests as $test => $result) {
  $output = from_camel_case($test);
  if ($output === $result) {
    echo "Pass: $test => $result\n";
  } else {
    echo "Fail: $test => $result [$output]\n";
  }
}

function from_camel_case($input) {
  preg_match_all('!([A-Z][A-Z0-9]*(?=$|[A-Z][a-z0-9])|[A-Za-z][a-z0-9]+)!', $input, $matches);
  $ret = $matches[0];
  foreach ($ret as &$match) {
    $match = $match == strtoupper($match) ? strtolower($match) : lcfirst($match);
  }
  return implode('_', $ret);
}

输出：

Pass: simpleTest => simple_test
Pass: easy => easy
Pass: HTML => html
Pass: simpleXML => simple_xml
Pass: PDFLoad => pdf_load
Pass: startMIDDLELast => start_middle_last
Pass: AString => a_string
Pass: Some4Numbers234 => some4_numbers234
Pass: TEST123String => test123_string

这实现了以下规则：

以小写字母开头的序列后面必须跟小写字母和数字；
以大写字母开头的序列可以后跟：
- 一个或多个大写字母和数字（后跟字符串结尾或大写字母后跟小写字母或数字，即下一个序列的开头）；或者
- 一个或多个小写字母或数字。

score 43 · Accepted Answer

一个简洁的解决方案，可以处理一些棘手的用例：

function decamelize($string) {
    return strtolower(preg_replace(['/([a-z\d])([A-Z])/', '/([^_])([A-Z][a-z])/'], '$1_$2', $string));
}

可以处理所有这些情况：

simpleTest => simple_test
easy => easy
HTML => html
simpleXML => simple_xml
PDFLoad => pdf_load
startMIDDLELast => start_middle_last
AString => a_string
Some4Numbers234 => some4_numbers234
TEST123String => test123_string
hello_world => hello_world
hello__world => hello__world
_hello_world_ => _hello_world_
hello_World => hello_world
HelloWorld => hello_world
helloWorldFoo => hello_world_foo
hello-world => hello-world
myHTMLFiLe => my_html_fi_le
aBaBaB => a_ba_ba_b
BaBaBa => ba_ba_ba
libC => lib_c

你可以在这里测试这个功能：http: //syframework.alwaysdata.net/decamelize

score 31 · Accepted Answer

Symfony 序列化器组件有一个CamelCaseToSnakeCaseNameConverter，它有两个方法normalize()和denormalize(). 这些可以按如下方式使用：

$nameConverter = new CamelCaseToSnakeCaseNameConverter();

echo $nameConverter->normalize('camelCase');
// outputs: camel_case

echo $nameConverter->denormalize('snake_case');
// outputs: snakeCase

score 24 · Accepted Answer

从 RubyString#camelize和String#decamelize.

function decamelize($word) {
  return preg_replace(
    '/(^|[a-z])([A-Z])/e', 
    'strtolower(strlen("\\1") ? "\\1_\\2" : "\\2")',
    $word 
  ); 
}

function camelize($word) { 
  return preg_replace('/(^|_)([a-z])/e', 'strtoupper("\\2")', $word); 
}

上述解决方案可能遗漏的一个技巧是 'e' 修饰符，它导致preg_replace将替换字符串评估为 PHP 代码。

score 22 · Accepted Answer

这里的大多数解决方案都让人感到手忙脚乱。这是我使用的：

$underscored = strtolower(
    preg_replace(
        ["/([A-Z]+)/", "/_([A-Z]+)([A-Z][a-z])/"], 
        ["_$1", "_$1_$2"], 
        lcfirst($camelCase)
    )
);

“CamelCASE”转换为“camel_case”

lcfirst($camelCase)将降低第一个字符（避免 'CamelCASE' 转换后的输出以下划线开头）
[A-Z]找到大写字母
+将每个连续的大写字母视为一个单词（避免将'CamelCASE'转换为camel_C_A_S_E）
第二种模式和替换是 for ThoseSPECCases->those_spec_cases而不是those_speccases
strtolower([…])将输出转换为小写

score 20 · Accepted Answer

php 没有为此 afaik 提供内置函数，但这是我使用的

function uncamelize($camel,$splitter="_") {
    $camel=preg_replace('/(?!^)[[:upper:]][[:lower:]]/', '$0', preg_replace('/(?!^)[[:upper:]]+/', $splitter.'$0', $camel));
    return strtolower($camel);

}

拆分器可以在函数调用中指定，所以你可以像这样调用它

$camelized="thisStringIsCamelized";
echo uncamelize($camelized,"_");
//echoes "this_string_is_camelized"
echo uncamelize($camelized,"-");
//echoes "this-string-is-camelized"

score 8 · Accepted Answer

您需要通过它运行一个匹配每个大写字母的正则表达式，除非它位于开头并将其替换为下划线加上该字母。一个 utf-8 解决方案是这样的：

header('content-type: text/html; charset=utf-8');
$separated = preg_replace('%(?<!^)\p{Lu}%usD', '_$0', 'AaaaBbbbCcccDdddÁáááŐőőő');
$lower = mb_strtolower($separated, 'utf-8');
echo $lower; //aaaa_bbbb_cccc_dddd_áááá_őőőő

如果你不确定你的字符串是什么大小写，最好先检查一下，因为这段代码假设输入是camelCase而不是underscore_Caseor dash-Case，所以如果后者有大写字母，它会为它们添加下划线。

cletus 接受的答案太复杂了，恕我直言，它仅适用于拉丁字符。我发现这是一个非常糟糕的解决方案，并且想知道为什么它被接受了。转换TEST123String为test123_string不一定是有效的要求。我宁愿保持简单并分开ABCccc，而a_b_cccc不是ab_cccc因为它不会以这种方式丢失信息，并且反向转换将给出与我们开始时完全相同的字符串。即使您想以另一种方式进行操作，(?<!^)\p{Lu}\p{Ll}|(?<=\p{Ll})\p{Lu}如果您不是正则表达式专家，也可以相对容易地为它编写一个正则表达式，使用正则后向或两个没有后向的正则表达式。strtolower无需将其拆分为子字符串，更不用说决定在lcfirst哪里使用juststrtolower完全没问题。

score 8 · Accepted Answer

“CamelCase”到“camel_case”：

function camelToSnake($camel)
{
    $snake = preg_replace('/[A-Z]/', '_$0', $camel);
    $snake = strtolower($snake);
    $snake = ltrim($snake, '_');
    return $snake;
}

或者：

function camelToSnake($camel)
{
    $snake = preg_replace_callback('/[A-Z]/', function ($match){
        return '_' . strtolower($match[0]);
    }, $camel);
    return ltrim($snake, '_');
}

score 7 · Accepted Answer

如果您正在寻找 PHP 5.4 版本和更高版本的答案，则代码如下：

function decamelize($word) {
      return $word = preg_replace_callback(
        "/(^|[a-z])([A-Z])/",
        function($m) { return strtolower(strlen($m[1]) ? "$m[1]_$m[2]" : "$m[2]"); },
        $word
    );

}
function camelize($word) {
    return $word = preg_replace_callback(
        "/(^|_)([a-z])/",
        function($m) { return strtoupper("$m[2]"); },
        $word
    );

}

score 7 · Accepted Answer

我遇到了类似的问题，但找不到任何满足如何将 CamelCase 转换为 snake_case 的答案，同时避免_使用下划线或全部大写缩写的名称出现重复或多余的下划线。

问题如下：

CamelCaseClass            => camel_case_class
ClassName_WithUnderscores => class_name_with_underscore
FAQ                       => faq

我写的解决方案是一个简单的两个函数调用，小写和搜索并替换连续的小写-大写字母：

strtolower(preg_replace("/([a-z])([A-Z])/", "$1_$2", $name));

score 5 · Accepted Answer

简短的解决方案：

$subject = "PascalCase";
echo strtolower(preg_replace('/\B([A-Z])/', '_$1', $subject));

score 4 · Accepted Answer

一点都不花哨，但简单而快速：

function uncamelize($str) 
{
    $str = lcfirst($str);
    $lc = strtolower($str);
    $result = '';
    $length = strlen($str);
    for ($i = 0; $i < $length; $i++) {
        $result .= ($str[$i] == $lc[$i] ? '' : '_') . $lc[$i];
    }
    return $result;
}

echo uncamelize('HelloAWorld'); //hello_a_world

score 3 · Accepted Answer

可以在Alchitect源代码中找到不使用正则表达式的版本：

decamelize($str, $glue='_')
{
    $counter  = 0;
    $uc_chars = '';
    $new_str  = array();
    $str_len  = strlen($str);

    for ($x=0; $x<$str_len; ++$x)
    {
        $ascii_val = ord($str[$x]);

        if ($ascii_val >= 65 && $ascii_val <= 90)
        {
            $uc_chars .= $str[$x];
        }
    }

    $tok = strtok($str, $uc_chars);

    while ($tok !== false)
    {
        $new_char  = chr(ord($uc_chars[$counter]) + 32);
        $new_str[] = $new_char . $tok;
        $tok       = strtok($uc_chars);

        ++$counter;
    }

    return implode($new_str, $glue);
}

score 3 · Accepted Answer

所以这里有一个单行：

strtolower(preg_replace('/(?|([a-z\d])([A-Z])|([^\^])([A-Z][a-z]))/', '$1_$2', $string));

score 3 · Accepted Answer

danielstjules/Stringy提供了一种将字符串从驼峰式转换为蛇形的方法。

s('TestUCase')->underscored(); // 'test_u_case'

score 3 · Accepted Answer

Laravel 5.6 提供了一种非常简单的方法：

 /**
 * Convert a string to snake case.
 *
 * @param  string  $value
 * @param  string  $delimiter
 * @return string
 */
public static function snake($value, $delimiter = '_'): string
{
    if (!ctype_lower($value)) {
        $value = strtolower(preg_replace('/(.)(?=[A-Z])/u', '$1'.$delimiter, $value));
    }

    return $value;
}

它的作用：如果它发现给定字符串中至少有一个大写字母，它会使用正向前瞻来搜索任何字符 ( .) 后跟一个大写字母 ( (?=[A-Z]))。然后它用它的值替换找到的字符，后跟分隔符_。

score 2 · Accepted Answer

来自 rails 的直接端口（减去它们对 :: 或首字母缩写词的特殊处理）将是

function underscore($word){
    $word = preg_replace('#([A-Z\d]+)([A-Z][a-z])#','\1_\2', $word);
    $word = preg_replace('#([a-z\d])([A-Z])#', '\1_\2', $word);
    return strtolower(strtr($word, '-', '_'));
}

了解 PHP，这将比此处给出的其他答案中发生的手动解析更快。缺点是您无法选择使用什么作为单词之间的分隔符，但这不是问题的一部分。

还要检查相关的rails源代码

请注意，这旨在与 ASCII 标识符一起使用。如果您需要对 ASCII 范围之外的字符执行此操作，请使用 '/u' 修饰符preg_match并使用mb_strtolower.

score 2 · Accepted Answer

这是我对一个六年前的问题的贡献，天知道有多少答案……

它会将提供的字符串中所有以驼峰命名的单词转换为蛇形。例如，“SuperSpecialAwesome and also FizBuzz καιΚάτιΑκόμα”将被转换为“super_special_awesome and also fizz_buzz και_κάτι_ακόμα”。

mb_strtolower(
    preg_replace_callback(
        '/(?<!\b|_)\p{Lu}/u',
        function ($a) {
            return "_$a[0]";
        },
        'SuperSpecialAwesome'
    )
);

score 2 · Accepted Answer

Yii2 具有不同的功能，可以从 CamelCase 制作单词 snake_case。

    /**
     * Converts any "CamelCased" into an "underscored_word".
     * @param string $words the word(s) to underscore
     * @return string
     */
    public static function underscore($words)
    {
        return strtolower(preg_replace('/(?<=\\w)([A-Z])/', '_\\1', $words));
    }

score 2 · Accepted Answer

如果您没有使用 Composer for PHP，那么您就是在浪费时间。

composer require doctrine/inflector

use Doctrine\Inflector\InflectorFactory;

// Couple ways to get class name:

// If inside a parent class
$class_name = get_called_class();

// Or just inside the class
$class_name = get_class();

// Or straight get a class name
$class_name = MyCustomClass::class;

// Or, of course, a string
$class_name = 'App\Libs\MyCustomClass';

// Take the name down to the base name:
$class_name = end(explode('\\', $class_name)));

$inflector = InflectorFactory::create()->build();

$inflector->tableize($class_name); // my_custom_class

https://github.com/doctrine/inflector/blob/master/docs/en/index.rst

score 1 · Accepted Answer

如何在不使用正则表达式的情况下进行 de-camelize：

function decamelize($str, $glue = '_') {
    $capitals = [];
    $replace  = [];

    foreach(str_split($str) as $index => $char) {
        if(!ctype_upper($char)) {
            continue;
        }

        $capitals[] = $char;
        $replace[]  = ($index > 0 ? $glue : '') . strtolower($char);
    }

    if(count($capitals) > 0) {
        return str_replace($capitals, $replace, $str);
    }

    return $str;
}

编辑：

我将如何在 2019 年做到这一点：

function toSnakeCase($str, $glue = '_') {
    return preg_replace_callback('/[A-Z]/', function ($matches) use ($glue) {
        return $glue . strtolower($matches[0]);
    }, $str);
}

当 PHP 7.4 发布时：

function toSnakeCase($str, $glue = '_') {
    return preg_replace_callback('/[A-Z]/', fn($matches) => $glue . strtolower($matches[0]), $str);
}

score 1 · Accepted Answer

function camel2snake($name) {
    $str_arr = str_split($name);
    foreach ($str_arr as $k => &$v) {
        if (ord($v) >= 64 && ord($v) <= 90) { // A = 64; Z = 90
            $v = strtolower($v);
            $v = ($k != 0) ? '_'.$v : $v;
        }
    }
    return implode('', $str_arr);
}

score 1 · Accepted Answer

这里最糟糕的答案几乎是最好的（使用框架）。不，不要，看看源代码。看看一个完善的框架使用什么将是一种更可靠的方法（经过试验和测试）。Zend 框架有一些适合您需要的单词过滤器。来源。

这是我从源代码中改编的几种方法。

function CamelCaseToSeparator($value,$separator = ' ')
{
    if (!is_scalar($value) && !is_array($value)) {
        return $value;
    }
    if (defined('PREG_BAD_UTF8_OFFSET_ERROR') && preg_match('/\pL/u', 'a') == 1) {
        $pattern     = ['#(?<=(?:\p{Lu}))(\p{Lu}\p{Ll})#', '#(?<=(?:\p{Ll}|\p{Nd}))(\p{Lu})#'];
        $replacement = [$separator . '\1', $separator . '\1'];
    } else {
        $pattern     = ['#(?<=(?:[A-Z]))([A-Z]+)([A-Z][a-z])#', '#(?<=(?:[a-z0-9]))([A-Z])#'];
        $replacement = ['\1' . $separator . '\2', $separator . '\1'];
    }
    return preg_replace($pattern, $replacement, $value);
}
function CamelCaseToUnderscore($value){
    return CamelCaseToSeparator($value,'_');
}
function CamelCaseToDash($value){
    return CamelCaseToSeparator($value,'-');
}
$string = CamelCaseToUnderscore("CamelCase");

score 1 · Accepted Answer

1

有一个提供此功能的库：

SnakeCaseFormatter::run('CamelCase'); // Output: "camel_case"

于 2016-04-02T01:04:31.200 回答

score 1 · Accepted Answer

1

如果你使用 Laravel 框架，你可以只使用snake_case()方法。

于 2016-11-11T16:25:48.130 回答

score 1 · Accepted Answer

这是较短的方法之一：

function camel_to_snake($input)
{
    return strtolower(ltrim(preg_replace('/([A-Z])/', '_\\1', $input), '_'));
}

score 0 · Accepted Answer

使用 Zend Word Filters的 Filter 类很容易：

<?php
namespace MyNamespace\Utility;

use Zend\Filter\Word\CamelCaseToUnderscore;
use Zend\Filter\Word\UnderscoreToCamelCase;

class String
{
    public function test()
    {
        $underscoredStrings = array(
            'simple_test',
            'easy',
            'html',
            'simple_xml',
            'pdf_load',
            'start_middle_last',
            'a_string',
            'some4_numbers234',
            'test123_string',
        );
        $camelCasedStrings = array(
            'simpleTest',
            'easy',
            'HTML',
            'simpleXML',
            'PDFLoad',
            'startMIDDLELast',
            'AString',
            'Some4Numbers234',
            'TEST123String',
        );
        echo PHP_EOL . '-----' . 'underscoreToCamelCase' . '-----' . PHP_EOL;
        foreach ($underscoredStrings as $rawString) {
            $filteredString = $this->underscoreToCamelCase($rawString);
            echo PHP_EOL . $rawString . ' >>> ' . $filteredString . PHP_EOL;
        }
        echo PHP_EOL . '-----' . 'camelCaseToUnderscore' . '-----' . PHP_EOL;
        foreach ($camelCasedStrings as $rawString) {
            $filteredString = $this->camelCaseToUnderscore($rawString);
            echo PHP_EOL . $rawString . ' >>> ' . $filteredString . PHP_EOL;
        }
    }

    public function camelCaseToUnderscore($input)
    {
        $camelCaseToSeparatorFilter = new CamelCaseToUnderscore();
        $result = $camelCaseToSeparatorFilter->filter($input);
        $result = strtolower($result);
        return $result;
    }

    public function underscoreToCamelCase($input)
    {
        $underscoreToCamelCaseFilter = new UnderscoreToCamelCase();
        $result = $underscoreToCamelCaseFilter->filter($input);
        return $result;
    }
}

-----下划线转驼峰式-----

简单测试 >>> 简单测试

简单>>>简单

html >>> html

simple_xml >>> SimpleXml

pdf_load >>> PdfLoad

start_middle_last >>> StartMiddleLast

a_string >>> AString

some4_numbers234 >>> Some4Numbers234

test123_string >>> Test123String

-----camelCaseToUnderscore-----

简单测试 >>> 简单测试

简单>>>简单

html >>> html

simpleXML >>> simple_xml

PDFLoad >>> pdf_load

startMIDDLElast >>> start_middle_last

AString >>> a_string

Some4Numbers234 >>> some4_numbers234

TEST123String >>> test123_string

score 0 · Accepted Answer

开源的 TurboCommons 库在 StringUtils 类中包含一个通用的 formatCase() 方法，它允许您将字符串转换为许多常见的大小写格式，例如 CamelCase、UpperCamelCase、LowerCamelCase、snake_case、Title Case 等等。

https://github.com/edertone/TurboCommons

要使用它，请将 phar 文件导入您的项目，然后：

use org\turbocommons\src\main\php\utils\StringUtils;

echo StringUtils::formatCase('camelCase', StringUtils::FORMAT_SNAKE_CASE);

// will output 'camel_Case'

score 0 · Accepted Answer

$str = 'FooBarBaz';

return strtolower(preg_replace('~(?<=\\w)([A-Z])~', '_$1', $str)); // foo_bar_baz

score 0 · Accepted Answer

使用Symfony 字符串

composer require symfony/string

use function Symfony\Component\String\u;

u($string)->snake()->toString()

score -1 · Accepted Answer

如果你可以开始：

$string = 'Camel_Case'; // underscore or any other separator...

然后你可以转换为任何一种情况：

$pascal = str_replace("_", "", $string);
$snake = strtolower($string);

或任何其他情况：

$capitalized = str_replace("_", " ", $string); // Camel Case
$constant = strtoupper($string);               // CAMEL_CASE
$train = str_replace("_", "-", $snake);        // camel-case

php - 如何将 PascalCase 转换为 snake_case？

32 回答 32

Related

Reference