我正在做一些文本处理,我需要将一个字符串切割成短子字符串。我使用了 cut 但它似乎会根据字节切割我的字符串。我的文本是多字节 utf8 编码文本的混合,使用 cut 通常会导致最后几个字节是无效的 utf8 字节,这会给我的进一步处理带来问题。所以我想知道是否有合适的方法来做到这一点?
PS我已经尝试过 -c 参数,但它仍然会减少字节数。
例如(机器语言环境为 en_GB.UTF-8)
echo "非常的危险" | 剪切-c -6
是非
echo "非常的危险" | 剪切-c -7
是非
echo "非常的危险" | 剪切-c -8
是非
echo "非常的危险" | 剪切-c -9
是非常</p>