我在 Bash 中有一个字符串:
string="My string"
如何测试它是否包含另一个字符串?
if [ $string ?? 'foo' ]; then
echo "It's there!"
fi
??
我不知名的接线员在哪里。我使用echo
andgrep
吗?
if echo "$string" | grep 'foo'; then
echo "It's there!"
fi
这看起来有点笨拙。
如果您使用双括号,您也可以在 case 语句之外使用Marcus 的答案(* 通配符) :
string='My long string'
if [[ $string == *"My long"* ]]; then
echo "It's there!"
fi
注意针字符串中的空格需要放在双引号之间,*
通配符应该在外面。另请注意,使用了一个简单的比较运算符(即==
),而不是正则表达式运算符=~
。
如果您更喜欢正则表达式方法:
string='My string';
if [[ $string =~ "My" ]]; then
echo "It's there!"
fi
我不确定是否使用 if 语句,但您可以使用 case 语句获得类似的效果:
case "$string" in
*foo*)
# Do stuff
;;
esac
stringContain
变体(兼容或独立于大小写)由于这些 Stack Overflow 的答案主要讲述了Bash,我在这篇文章的最底部发布了一个独立于案例的 Bash 函数......
反正有我的
由于已经有很多使用 Bash 特定功能的答案,因此有一种方法可以在功能较差的 shell 下工作,例如BusyBox:
[ -z "${string##*$reqsubstr*}" ]
在实践中,这可以给出:
string='echo "My string"'
for reqsubstr in 'o "M' 'alt' 'str';do
if [ -z "${string##*$reqsubstr*}" ] ;then
echo "String '$string' contain substring: '$reqsubstr'."
else
echo "String '$string' don't contain substring: '$reqsubstr'."
fi
done
这是在 Bash、Dash、KornShell ( ksh
) 和ash (BusyBox) 下测试的,结果始终是:
String 'echo "My string"' contain substring: 'o "M'.
String 'echo "My string"' don't contain substring: 'alt'.
String 'echo "My string"' contain substring: 'str'.
正如@EeroAaltonen 所问,这里是同一演示的一个版本,在相同的外壳下进行了测试:
myfunc() {
reqsubstr="$1"
shift
string="$@"
if [ -z "${string##*$reqsubstr*}" ] ;then
echo "String '$string' contain substring: '$reqsubstr'.";
else
echo "String '$string' don't contain substring: '$reqsubstr'."
fi
}
然后:
$ myfunc 'o "M' 'echo "My String"'
String 'echo "My String"' contain substring 'o "M'.
$ myfunc 'alt' 'echo "My String"'
String 'echo "My String"' don't contain substring 'alt'.
注意:您必须转义或双引号和/或双引号:
$ myfunc 'o "M' echo "My String"
String 'echo My String' don't contain substring: 'o "M'.
$ myfunc 'o "M' echo \"My String\"
String 'echo "My String"' contain substring: 'o "M'.
这是在 BusyBox、Dash,当然还有 Bash 下测试的:
stringContain() { [ -z "${2##*$1*}" ]; }
那么现在:
$ if stringContain 'o "M3' 'echo "My String"';then echo yes;else echo no;fi
no
$ if stringContain 'o "M' 'echo "My String"';then echo yes;else echo no;fi
yes
...或者如果提交的字符串可能是空的,正如@Sjlver 所指出的那样,该函数将变为:
stringContain() { [ -z "${2##*$1*}" ] && [ -z "$1" -o -n "$2" ]; }
或如Adrian Günter 的评论所建议的那样,避免-o
开关:
stringContain() { [ -z "${2##*$1*}" ] && { [ -z "$1" ] || [ -n "$2" ];};}
并反转测试以使它们可能更快:
stringContain() { [ -z "$1" ] || { [ -z "${2##*$1*}" ] && [ -n "$2" ];};}
使用空字符串:
$ if stringContain '' ''; then echo yes; else echo no; fi
yes
$ if stringContain 'o "M' ''; then echo yes; else echo no; fi
no
要在不区分大小写的情况下测试字符串,只需将每个字符串转换为小写即可:
stringContain() {
local _lc=${2,,}
[ -z "$1" ] || { [ -z "${_lc##*${1,,}*}" ] && [ -n "$2" ] ;} ;}
查看:
stringContain 'o "M3' 'echo "my string"' && echo yes || echo no
no
stringContain 'o "My' 'echo "my string"' && echo yes || echo no
yes
if stringContain '' ''; then echo yes; else echo no; fi
yes
if stringContain 'o "M' ''; then echo yes; else echo no; fi
no
您应该记住,shell 脚本与其说是一种语言,不如说是一组命令。您本能地认为这种“语言”要求您遵循if
a[
或 a [[
。这两个只是返回指示成功或失败的退出状态的命令(就像所有其他命令一样)。出于这个原因,我会使用grep
,而不是[
命令。
做就是了:
if grep -q foo <<<"$string"; then
echo "It's there"
fi
既然您正在考虑if
测试其后命令的退出状态(用分号完成),为什么不重新考虑您正在测试的字符串的来源呢?
## Instead of this
filetype="$(file -b "$1")"
if grep -q "tar archive" <<<"$filetype"; then
#...
## Simply do this
if file -b "$1" | grep -q "tar archive"; then
#...
该-q
选项使 grep 不输出任何内容,因为我们只需要返回码。<<<
使shell扩展下一个单词并将其用作命令的输入,这是here文档的单行版本<<
(我不确定这是标准还是Bashism)。
公认的答案是最好的,但由于有不止一种方法可以做到这一点,这里有另一种解决方案:
if [ "$string" != "${string/foo/}" ]; then
echo "It's there!"
fi
${var/search/replace}
是$var
与search
替换为的第一个实例replace
,如果找到它(它不会改变$var
)。如果你尝试用空替换foo
,并且字符串已经改变,那么显然foo
已经找到了。
所以这个问题有很多有用的解决方案——但哪个最快/使用最少的资源?
使用此框架重复测试:
/usr/bin/time bash -c 'a=two;b=onetwothree; x=100000; while [ $x -gt 0 ]; do TEST ; x=$(($x-1)); done'
每次更换 TEST:
[[ $b =~ $a ]] 2.92 user 0.06 system 0:02.99 elapsed 99% CPU
[ "${b/$a//}" = "$b" ] 3.16 user 0.07 system 0:03.25 elapsed 99% CPU
[[ $b == *$a* ]] 1.85 user 0.04 system 0:01.90 elapsed 99% CPU
case $b in *$a):;;esac 1.80 user 0.02 system 0:01.83 elapsed 99% CPU
doContain $a $b 4.27 user 0.11 system 0:04.41 elapsed 99%CPU
(doContain 在 F. Houri 的回答中)
对于咯咯笑:
echo $b|grep -q $a 12.68 user 30.86 system 3:42.40 elapsed 19% CPU !ouch!
因此,无论是在扩展测试还是案例中,简单的替换选项都可以预见地获胜。箱子是便携式的。
管道输出到 100000 个 greps 是可以预见的痛苦!关于无需使用外部实用程序的旧规则仍然适用。
这也有效:
if printf -- '%s' "$haystack" | egrep -q -- "$needle"
then
printf "Found needle in haystack"
fi
阴性测试是:
if ! printf -- '%s' "$haystack" | egrep -q -- "$needle"
then
echo "Did not find needle in haystack"
fi
我想这种风格更经典一些——更少依赖 Bash shell 的特性。
该--
参数是纯 POSIX 偏执狂,用于保护类似于选项的输入字符串,例如--abc
or -a
。
注意:在紧密循环中,此代码将比使用内部 Bash shell 功能慢得多,因为将创建一个(或两个)单独的进程并通过管道连接。
Bash 4+ 示例。注意:当单词包含空格等时,不使用引号会导致问题。始终在 Bash、IMO 中引用。
以下是 Bash 4+ 的一些示例:
示例 1,检查字符串中的“是”(不区分大小写):
if [[ "${str,,}" == *"yes"* ]] ;then
示例 2,检查字符串中的“是”(不区分大小写):
if [[ "$(echo "$str" | tr '[:upper:]' '[:lower:]')" == *"yes"* ]] ;then
示例 3,检查字符串中的“是”(区分大小写):
if [[ "${str}" == *"yes"* ]] ;then
示例 4,检查字符串中的“是”(区分大小写):
if [[ "${str}" =~ "yes" ]] ;then
示例 5,完全匹配(区分大小写):
if [[ "${str}" == "yes" ]] ;then
示例 6,完全匹配(不区分大小写):
if [[ "${str,,}" == "yes" ]] ;then
示例 7,完全匹配:
if [ "$a" = "$b" ] ;then
示例 8,通配符匹配 .ext(不区分大小写):
if echo "$a" | egrep -iq "\.(mp[3-4]|txt|css|jpg|png)" ; then
享受。
正如保罗在他的性能比较中提到的:
if echo "abcdefg" | grep -q "bcdef"; then
echo "String contains is true."
else
echo "String contains is not true."
fi
这是符合 POSIX 的,就像Marcus 提供的答案中的 'case "$string" 一样,但它比 case 语句的答案更容易阅读。另请注意,这将比使用 case 语句慢得多。正如保罗指出的那样,不要在循环中使用它。
这个怎么样:
text=" <tag>bmnmn</tag> "
if [[ "$text" =~ "<tag>" ]]; then
echo "matched"
else
echo "not matched"
fi
这个 Stack Overflow 答案是唯一一个捕获空格和破折号字符的答案:
# For null cmd arguments checking
to_check=' -t'
space_n_dash_chars=' -'
[[ $to_check == *"$space_n_dash_chars"* ]] && echo found
[[ $string == *foo* ]] && echo "It's there" || echo "Couldn't find"
一种是:
[ $(expr $mystring : ".*${search}.*") -ne 0 ] && echo 'yes' || echo 'no'
由于POSIX /BusyBox 问题在没有提供正确答案的情况下关闭(恕我直言),我将在此处发布答案。
最短的答案是:
[ ${_string_##*$_substring_*} ] || echo Substring found!
或者
[ "${_string_##*$_substring_*}" ] || echo 'Substring found!'
请注意,对于某些 shell ( ) ,双重哈希是强制性的。上面将在未找到子字符串时ash
进行评估。[ stringvalue ]
它不返回错误。当找到子字符串时,结果是空的,它计算[ ]
. 这将抛出错误代码 1,因为字符串被完全替换(由于*
)。
最短更常用的语法:
[ -z "${_string_##*$_substring_*}" ] && echo 'Substring found!'
或者
[ -n "${_string_##*$_substring_*}" ] || echo 'Substring found!'
另一个:
[ "${_string_##$_substring_}" != "$_string_" ] && echo 'Substring found!'
或者
[ "${_string_##$_substring_}" = "$_string_" ] || echo 'Substring found!'
注意单个等号!
我的.bash_profile文件以及我如何使用 grep:
如果 PATH 环境变量包括我的两个bin
目录,不要附加它们,
# .bash_profile
# Get the aliases and functions
if [ -f ~/.bashrc ]; then
. ~/.bashrc
fi
U=~/.local.bin:~/bin
if ! echo "$PATH" | grep -q "home"; then
export PATH=$PATH:${U}
fi
此处回答的问题的扩展如何判断一个字符串是否包含 POSIX sh 中的另一个字符串?:
此解决方案适用于特殊字符:
# contains(string, substring)
#
# Returns 0 if the specified string contains the specified substring,
# otherwise returns 1.
contains() {
string="$1"
substring="$2"
if echo "$string" | $(type -p ggrep grep | head -1) -F -- "$substring" >/dev/null; then
return 0 # $substring is in $string
else
return 1 # $substring is not in $string
fi
}
contains "abcd" "e" || echo "abcd does not contain e"
contains "abcd" "ab" && echo "abcd contains ab"
contains "abcd" "bc" && echo "abcd contains bc"
contains "abcd" "cd" && echo "abcd contains cd"
contains "abcd" "abcd" && echo "abcd contains abcd"
contains "" "" && echo "empty string contains empty string"
contains "a" "" && echo "a contains empty string"
contains "" "a" || echo "empty string does not contain a"
contains "abcd efgh" "cd ef" && echo "abcd efgh contains cd ef"
contains "abcd efgh" " " && echo "abcd efgh contains a space"
contains "abcd [efg] hij" "[efg]" && echo "abcd [efg] hij contains [efg]"
contains "abcd [efg] hij" "[effg]" || echo "abcd [efg] hij does not contain [effg]"
contains "abcd *efg* hij" "*efg*" && echo "abcd *efg* hij contains *efg*"
contains "abcd *efg* hij" "d *efg* h" && echo "abcd *efg* hij contains d *efg* h"
contains "abcd *efg* hij" "*effg*" || echo "abcd *efg* hij does not contain *effg*"
接受的答案是正确的,但很难阅读和理解。
对于与搜索相关的问题,您应该始终在 $haystack成语中使用$needle 。
由于其建议的编辑队列已满,因此我发布以下内容:
haystack='There are needles here.'
if [[ "$haystack" == *"needle"* ]]; then
echo "It's there!"
fi
grep -q
可用于此目的。
同样使用awk
:
string="unix-bash 2389"
character="@"
printf '%s' "$string" | awk -vc="$character" '{ if (gsub(c, "")) { print "Found" } else { print "Not Found" } }'
输出:
未找到
string="unix-bash 2389"
character="-"
printf '%s' "$string" | awk -vc="$character" '{ if (gsub(c, "")) { print "Found" } else { print "Not Found" } }'
输出:
成立
原文来源:http ://unstableme.blogspot.com/2008/06/bash-search-letter-in-string-awk.html
我发现经常需要这个功能,所以我.bashrc
像这样使用自制的 shell 函数,这样我就可以根据需要经常重复使用它,并且名称很容易记住:
function stringinstring()
{
case "$2" in
*"$1"*)
return 0
;;
esac
return 1
}
要测试$string1
(例如abc)是否包含在$string2
(例如123abcABC)中,我只需要运行stringinstring "$string1" "$string2"
并检查返回值,例如
stringinstring "$str1" "$str2" && echo YES || echo NO
我喜欢sed。
substr="foo"
nonsub="$(echo "$string" | sed "s/$substr//")"
hassub=0 ; [ "$string" != "$nonsub" ] && hassub=1
编辑,逻辑:
使用 sed 从字符串中删除子字符串的实例
如果新字符串与旧字符串不同,则存在子字符串
通用针 haystack示例跟随着变量
#!/bin/bash
needle="a_needle"
haystack="a_needle another_needle a_third_needle"
if [[ $haystack == *"$needle"* ]]; then
echo "needle found"
else
echo "needle NOT found"
fi
case $string in (*foo*)
# Do stuff
esac
这与https://stackoverflow.com/a/229585/11267590的答案相同。但简单的风格也符合 POSIX 标准。
试试 oobash。
它是一个面向 Bash 4 的 OO 风格的字符串库。它支持德语变音符号。它是用 Bash 编写的。
许多功能可用:-base64Decode
, -base64Encode
, -capitalize
, -center
, -charAt
, -concat
, -contains
, -count
, -endsWith
, -equals
, -equalsIgnoreCase
, -reverse
, -hashCode
, -indexOf
, -isAlnum
, -isAlpha
, -isAscii
, -isDigit
, -isEmpty
, -isHexDigit
, -isLowerCase
, -isSpace
, , -isPrintable
, -isUpperCase
, -isVisible
, -lastIndexOf
, -length
, -matches
, -replaceAll
, -replaceFirst
, -startsWith
, -substring
, -swapCase
, -toLowerCase
, -toString
, -toUpperCase
,-trim
和-zfill
.
查看包含示例:
[Desktop]$ String a testXccc
[Desktop]$ a.contains tX
true
[Desktop]$ a.contains XtX
false
精确单词匹配:
string='My long string'
exactSearch='long'
if grep -E -q "\b${exactSearch}\b" <<<${string} >/dev/null 2>&1
then
echo "It's there"
fi
我使用这个函数(不包括但很明显的一个依赖项)。它通过了如下所示的测试。如果函数返回值 > 0,则找到该字符串。您也可以轻松地返回 1 或 0。
function str_instr {
# Return position of ```str``` within ```string```.
# >>> str_instr "str" "string"
# str: String to search for.
# string: String to search.
typeset str string x
# Behavior here is not the same in bash vs ksh unless we escape special characters.
str="$(str_escape_special_characters "${1}")"
string="${2}"
x="${string%%$str*}"
if [[ "${x}" != "${string}" ]]; then
echo "${#x} + 1" | bc -l
else
echo 0
fi
}
function test_str_instr {
str_instr "(" "'foo@host (dev,web)'" | assert_eq 11
str_instr ")" "'foo@host (dev,web)'" | assert_eq 19
str_instr "[" "'foo@host [dev,web]'" | assert_eq 11
str_instr "]" "'foo@host [dev,web]'" | assert_eq 19
str_instr "a" "abc" | assert_eq 1
str_instr "z" "abc" | assert_eq 0
str_instr "Eggs" "Green Eggs And Ham" | assert_eq 7
str_instr "a" "" | assert_eq 0
str_instr "" "" | assert_eq 0
str_instr " " "Green Eggs" | assert_eq 6
str_instr " " " Green " | assert_eq 1
}
msg="message"
function check {
echo $msg | egrep [abc] 1> /dev/null
if [ $? -ne 1 ];
then
echo "found"
else
echo "not found"
fi
}
check
这将发现任何出现的 a 或 b 或 c