如何获取存储在变量中的字符串的长度并将其分配给另一个变量?
myvar="some string"
echo ${#myvar}
# 11
如何为输出设置另一个变量11
?
如何获取存储在变量中的字符串的长度并将其分配给另一个变量?
myvar="some string"
echo ${#myvar}
# 11
如何为输出设置另一个变量11
?
要获取存储在变量中的字符串的长度,请说:
myvar="some string"
size=${#myvar}
为了确认它已正确保存,echo
它:
$ echo "$size"
11
除了fedorqui 的正确答案,我想说明字符串长度和字节长度之间的区别:
myvar='Généralités'
chrlen=${#myvar}
oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#myvar}
LANG=$oLang LC_ALL=$oLcAll
printf "%s is %d char len, but %d bytes len.\n" "${myvar}" $chrlen $bytlen
将呈现:
Généralités is 11 char len, but 14 bytes len.
您甚至可以查看存储的字符:
myvar='Généralités'
chrlen=${#myvar}
oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#myvar}
printf -v myreal "%q" "$myvar"
LANG=$oLang LC_ALL=$oLcAll
printf "%s has %d chars, %d bytes: (%s).\n" "${myvar}" $chrlen $bytlen "$myreal"
会回答:
Généralités has 11 chars, 14 bytes: ($'G\303\251n\303\251ralit\303\251s').
注意:根据Isabell Cowan 的评论,我已将设置添加到$LC_ALL
with $LANG
。
参数工作与常规变量相同
showStrLen() {
local bytlen sreal oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#1}
printf -v sreal %q "$1"
LANG=$oLang LC_ALL=$oLcAll
printf "String '%s' is %d bytes, but %d chars len: %s.\n" "$1" $bytlen ${#1} "$sreal"
}
将作为
showStrLen théorème
String 'théorème' is 10 bytes, but 8 chars len: $'th\303\251or\303\250me'
printf
修正工具:如果你:
for string in Généralités Language Théorème Février "Left: ←" "Yin Yang ☯";do
printf " - %-14s is %2d char length\n" "'$string'" ${#string}
done
- 'Généralités' is 11 char length
- 'Language' is 8 char length
- 'Théorème' is 8 char length
- 'Février' is 7 char length
- 'Left: ←' is 7 char length
- 'Yin Yang ☯' is 10 char length
不是很漂亮的输出!
为此,这里有一个小功能:
strU8DiffLen() {
local charlen=${#1} LANG=C LC_ALL=C
return $(( ${#1} - charlen ))
}
或写在一行中:
strU8DiffLen() { local chLen=${#1} LANG=C LC_ALL=C;return $((${#1}-chLen));}
那么现在:
for string in Généralités Language Théorème Février "Left: ←" "Yin Yang ☯";do
strU8DiffLen "$string"
printf " - %-$((14+$?))s is %2d chars length, but uses %2d bytes\n" \
"'$string'" ${#string} $((${#string}+$?))
done
- 'Généralités' is 11 chars length, but uses 14 bytes
- 'Language' is 8 chars length, but uses 8 bytes
- 'Théorème' is 8 chars length, but uses 10 bytes
- 'Février' is 7 chars length, but uses 8 bytes
- 'Left: ←' is 7 chars length, but uses 9 bytes
- 'Yin Yang ☯' is 10 chars length, but uses 12 bytes
但是留下了一些奇怪的 UTF-8 行为,比如双行距字符、零行距字符、反向置换和其他不可能那么简单的行为......
查看diffU8test.sh或diffU8test.sh.txt以获得更多限制。
我想要最简单的情况,最后是这样的结果:
echo -n 'Tell me the length of this sentence.' | wc -m;
36
您可以使用:
MYSTRING="abc123"
MYLENGTH=$(printf "%s" "$MYSTRING" | wc -c)
wc -c
或wc --bytes
对于字节数 = Unicode 字符按 2、3 或更多字节计数。wc -m
或wc --chars
对于字符计数 = Unicode 字符被计算为单个,直到它们使用更多字节。如果您想将此与命令行或函数参数一起使用,请确保使用size=${#1}
而不是size=${#$1}
. 第二个可能更本能,但语法不正确。
使用您提供的示例
#KISS (Keep it simple stupid)
size=${#myvar}
echo $size
以下是计算变量长度的几种方法:
echo ${#VAR}
echo -n $VAR | wc -m
echo -n $VAR | wc -c
printf $VAR | wc -m
expr length $VAR
expr $VAR : '.*'
并将结果设置在另一个变量中,只需将带有反引号的上述命令分配给另一个变量,如下所示:
otherVar=`echo -n $VAR | wc -m`
echo $otherVar
http://techopsbook.blogspot.in/2017/09/how-to-find-length-of-string-variable.html
我知道 Q 和 A 已经够老了,但今天我第一次面对这个任务。通常我使用该${#var}
组合,但使用 unicode 失败:我使用 bash 处理的大多数文本都是西里尔文......根据@atesin 的回答,我制作了简短的(并准备好更短的)函数,该函数可能可用于脚本。这是一项让我想到这个问题的任务:在伪图形框中显示一些可变长度的消息。所以,这里是:
$ cat draw_border.sh
#!/bin/sh
#based on https://stackoverflow.com/questions/17368067/length-of-string-in-bash
border()
{
local BPAR="$1"
local BPLEN=`echo $BPAR|wc -m`
local OUTLINE=\|\ "$1"\ \|
# line below based on https://www.cyberciti.biz/faq/repeat-a-character-in-bash-script-under-linux-unix/
# comment of Bit Twiddler Jun 5, 2021 @ 8:47
local OUTBORDER=\+`head -c $(($BPLEN+1))</dev/zero|tr '\0' '-'`\+
echo $OUTBORDER
echo $OUTLINE
echo $OUTBORDER
}
border "Généralités"
border 'А вот еще одна '$LESSCLOSE' '
border "pure ENGLISH"
这个样本产生了什么:
$ draw_border.sh
+-------------+
| Généralités |
+-------------+
+----------------------------------+
| А вот еще одна /usr/bin/lesspipe |
+----------------------------------+
+--------------+
| pure ENGLISH |
+--------------+
第一个例子(法语?)取自上面某人的例子。第二个结合了西里尔字母和一些变量的值。第三个是不言自明的:只有 1s 1/2 的 ASCII 字符。
我使用echo $BPAR|wc -m
而不是printf ...
为了不依赖 printf 是否内置。
上面我看到了关于尾随换行符和-n
参数的讨论echo
。我没有使用它,因此我只在$BPLEN
. 如果我使用-n
,我必须添加 2。
要解释 和 之间的区别wc -m
,wc -c
请参阅相同的脚本,只有一个小改动:-m
被替换为-c
$ draw_border.sh
+----------------+
| Généralités |
+----------------+
+---------------------------------------------+
| А вот еще одна /usr/bin/lesspipe |
+---------------------------------------------+
+--------------+
| pure ENGLISH |
+--------------+
拉丁文的重音字符和西里尔文的大部分字符都是两字节的,因此绘制的水平线的长度大于消息的实际长度。希望,它会节省一些时间:-)
ps 俄罗斯文字说“这里还有一个”
pps 工作“双线”
#!/bin/sh
#based on https://stackoverflow.com/questions/17368067/length-of-string-in-bash
border()
{
# line below based on https://www.cyberciti.biz/faq/repeat-a-character-in-bash-script-under-linux-unix/
# comment of Bit Twiddler Jun 5, 2021 @ 8:47
local OUTBORDER=\+`head -c $(( $(echo "$1"|wc -m) +1))</dev/zero|tr '\0' '-'`\+
echo $OUTBORDER"\n"\|\ "$1"\ \|"\n"$OUTBORDER
}
border "Généralités"
border 'А вот еще одна '$LESSCLOSE' '
border "pure ENGLISH"
为了不让重复的 OUTBORDER 的绘制使代码混乱,我将 OUTBORDER 的形成放在单独的命令中