问问题
76 次
3 回答
3
Golang 中的Unicode字符(如汉字)占用 3 个字节,而 ASCII 仅占用 1 个字节。这是设计使然。
如果您想检查 unicode 字符的实际字符串大小,请使用unicode/utf8内置包。
fmt.Printf("String: %s\nLength: %d\nRune Length: %d\n", c, len(c), utf8.RuneCountInString(c))
// String: 这是一个测试
// Length: 18
// Rune Length: 6
更基本的计数方法是使用 for 循环。
count := 0
for range "这是一个测试" {
count++
}
fmt.Printf("Count=%d\n", count)
// Count=6
关于表格格式中英文字符串的漂亮打印,似乎没有直接的办法。tabwriter 在这种情况下也不起作用。一个小技巧是使用 csv writer,如下所示:
data := [][]string{
{"这是一个测试", "|"},
{"aaaaaaaaaa", "|"},
{"つのだ☆HIRO", "|"},
{"aaaaaaaaaa", "|"},
}
w := csv.NewWriter(os.Stdout)
defer w.Flush()
w.Comma = '\t'
for _, row := range data {
w.Write(row)
}
这应该按预期打印数据。不幸的是,StackOverflow 打印的格式与我在终端中看到的格式不同。但是游乐场来拯救我们。点击这里
Note
:这适用于符文大小彼此足够接近的字符串。对于更长的字符串,您需要更多的解决方法。
于 2021-10-13T18:55:40.677 回答
0
您的问题是(正如mkopriva 在评论中指出的那样)一个显示问题,无法通过任何计数技巧来解决。
当我们用英语显示可变间距或比例文本与等宽文本时,我们会遇到同样的问题。也就是说,比较:
mmmm, tasty
iiii, tasty?
和:
嗯,好吃
iiii,好吃吗?
(假设您使用浏览器阅读此答案!)。我们不用打印汉字,甚至不用留下简单的ASCII就有问题!
您需要的是为您的中文文本提供等宽显示字体,或者可能是一些以表格形式排版的软件,而您是如何获得的……完全是另一个问题。
于 2021-10-13T19:15:27.460 回答
0
我想这就是你想要的
func TestChinese(t *testing.T) {
tests := []string{
"这是一个测试",
"aaaaaaaaa",
"つのだ☆HIRO",
"aaaaaaaaaa",
"这是aaaaa一个测试",
"这是一个つの测试",
}
for _, tt := range tests {
fmt.Printf("%s\t%d\t%d\n", tt, len([]rune(tt)), len([]byte(tt)))
}
}
输出:
这是一个测试 6 18
aaaaaaaaa 9 9
つのだ☆HIRO 8 16
aaaaaaaaaa 10 10
这是aaaaa一个测试 11 23
这是一个つの测试 8 24
于 2021-10-14T03:29:09.110 回答