如何使字符串人性化?基于以下标准:
- 删除前导下划线(如果有)。
- 如果有的话,用空格替换下划线。
- 第一个单词大写。
例如:
this is a test -> This is a test
foo Bar Baz -> Foo bar baz
foo_bar -> Foo bar
foo_bar_baz -> Foo bar baz
foo-bar -> Foo-bar
fooBarBaz -> FooBarBaz
如何使字符串人性化?基于以下标准:
- 删除前导下划线(如果有)。
- 如果有的话,用空格替换下划线。
- 第一个单词大写。
例如:
this is a test -> This is a test
foo Bar Baz -> Foo bar baz
foo_bar -> Foo bar
foo_bar_baz -> Foo bar baz
foo-bar -> Foo-bar
fooBarBaz -> FooBarBaz
最好的确实是使用一些正则表达式:
^[\s_]+|[\s_]+$
^
在字符串的开头 ( ) 或结尾 ( )捕获 1 个或多个空白字符或下划线$
。请注意,这也会捕获换行符。用空字符串替换它们。
[_\s]+
再次捕获 1 个或多个空白字符或下划线,因为字符串开头/结尾的那些已经消失,替换为 1 个空格。
^[a-z]
在字符串的开头捕获一个小写字母。替换为匹配的大写版本(您需要一个回调函数)。
结合:
function humanize(str) {
return str
.replace(/^[\s_]+|[\s_]+$/g, '')
.replace(/[_\s]+/g, ' ')
.replace(/^[a-z]/, function(m) { return m.toUpperCase(); });
}
document.getElementById('out').value = [
' this is a test',
'foo Bar Baz',
'foo_bar',
'foo-bar',
'fooBarBaz',
'_fooBarBaz____',
'_alpha',
'hello_ _world, how are________you? '
].map(humanize).join('\n');
textarea { width:100%; }
<textarea id="out" rows="10"></textarea>
这涵盖了您的所有情况:
var tests = [
'this is a test',
'foo Bar Baz',
...
]
var res = tests.map(function(test) {
return test
.replace(/_/g, ' ')
.trim()
.replace(/\b[A-Z][a-z]+\b/g, function(word) {
return word.toLowerCase()
})
.replace(/^[a-z]/g, function(first) {
return first.toUpperCase()
})
})
console.log(res)
/*
[ 'This is a test',
'Foo bar baz',
'Foo bar',
'Foo-bar',
'FooBarBaz' ]
*/
Lodash 有_.startCase
利于人性化对象键。将下划线破折号和驼峰式大小写转换为空格。
在您的情况下,您想大写但保持驼峰式大小写。这个问题是不久前被问到的。我目前的偏好是创建一个处理突变的类。它更容易测试和维护。因此,如果将来您需要支持将“1Item”转换为“First item”之类的转换,则可以编写一个具有单一职责的函数。
下面的计算成本更高,但更易于维护。有一个清晰的功能toHumanString
,易于理解和修改。
export class HumanizableString extends String {
capitalizeFirstLetter() => {
const transformed = this.charAt(0).toUpperCase() + this.slice(1);
return new HumanizableString(transformed);
};
lowerCaseExceptFirst() => {
const transformed = this.charAt(0) + this.slice(1).toLowerCase();
return new HumanizableString(transformed);
};
camelCaseToSpaces() => {
const camelMatch = /([A-Z])/g;
return new HumanizableString(this.replace(camelMatch, " $1"));
};
underscoresToSpaces() => {
const camelMatch = /_/g;
return new HumanizableString(this.replace(camelMatch, " "));
};
toHumanString() => {
return this.camelCaseToSpaces()
.underscoresToSpaces()
.capitalizeFirstLetter()
.lowerCaseExceptFirst()
.toString();
};
}
至少您应该命名您的正则表达式以使其更具可读性。
export const humanise = (value) => {
const camelMatch = /([A-Z])/g;
const underscoreMatch = /_/g;
const camelCaseToSpaces = value.replace(camelMatch, " $1");
const underscoresToSpaces = camelCaseToSpaces.replace(underscoreMatch, " ");
const caseCorrected =
underscoresToSpaces.charAt(0).toUpperCase() +
underscoresToSpaces.slice(1).toLowerCase();
return caseCorrected;
};
尽管我认为正则表达式专家能够在单行中做这样的事情,但我个人会做这样的事情。
function humanize(str) {
return str.trim().split(/\s+/).map(function(str) {
return str.replace(/_/g, ' ').replace(/\s+/, ' ').trim();
}).join(' ').toLowerCase().replace(/^./, function(m) {
return m.toUpperCase();
});
}
测试:
[
' this is a test',
'foo Bar Baz',
'foo_bar',
'foo-bar',
'fooBarBaz',
'_fooBarBaz____',
'_alpha',
'hello_ _world, how are________you? '
].map(humanize);
/* Result:
[
"This is a test",
"Foo bar baz",
"Foo bar",
"Foo-bar",
"Foobarbaz",
"Foobarbaz",
"Alpha",
"Hello world, how are you?"
]
*/
另外一个选项:
const humanize = (s) => {
if (typeof s !== 'string') return s
return s
.replace(/^[\s_]+|[\s_]+$/g, '')
.replace(/[_\s]+/g, ' ')
.replace(/\-/g, ' ')
.replace(/^[a-z]/, function(m) { return m.toUpperCase(); });
}