2
4

3 回答 3

3

Golang 中的Unicode字符(如汉字)占用 3 个字节,而 ASCII 仅占用 1 个字节。这是设计使然。

如果您想检查 unicode 字符的实际字符串大小,请使用unicode/utf8内置包。

fmt.Printf("String: %s\nLength: %d\nRune Length: %d\n", c, len(c), utf8.RuneCountInString(c))
// String: 这是一个测试
// Length: 18
// Rune Length: 6

更基本的计数方法是使用 for 循环。

count := 0
for range "这是一个测试" {
    count++
}
fmt.Printf("Count=%d\n", count)
// Count=6

关于表格格式中英文字符串的漂亮打印,似乎没有直接的办法。tabwriter 在这种情况下也不起作用。一个小技巧是使用 csv writer,如下所示:

data := [][]string{
    {"这是一个测试", "|"},
    {"aaaaaaaaaa", "|"},
    {"つのだ☆HIRO", "|"},
    {"aaaaaaaaaa", "|"},
}

w := csv.NewWriter(os.Stdout)
defer w.Flush()
w.Comma = '\t'

for _, row := range data {
    w.Write(row)
}

这应该按预期打印数据。不幸的是,StackOverflow 打印的格式与我在终端中看到的格式不同。但是游乐场来拯救我们。点击这里

Note:这适用于符文大小彼此足够接近的字符串。对于更长的字符串,您需要更多的解决方法。

于 2021-10-13T18:55:40.677 回答
0

您的问题是(正如mkopriva 在评论中指出的那样)一个显示问题,无法通过任何计数技巧来解决。

当我们用英语显示可变间距或比例文本与等宽文本时,我们会遇到同样的问题。也就是说,比较:

mmmm, tasty
iiii, tasty?

和:

    嗯,好吃
    iiii,好吃吗?

(假设您使用浏览器阅读此答案!)。我们不用打印汉字,甚至不用留下简单的ASCII就有问题!

您需要的是为您的中文文本提供等宽显示字体,或者可能是一些以表格形式排版的软件,而您是如何获得的……完全是另一个问题。

于 2021-10-13T19:15:27.460 回答
0

我想这就是你想要的

func TestChinese(t *testing.T) {
    tests := []string{
        "这是一个测试",
        "aaaaaaaaa",
        "つのだ☆HIRO",
        "aaaaaaaaaa",
        "这是aaaaa一个测试",
        "这是一个つの测试",
    }
    for _, tt := range tests {
        fmt.Printf("%s\t%d\t%d\n", tt, len([]rune(tt)), len([]byte(tt)))
    }
}

输出:

这是一个测试  6   18
aaaaaaaaa   9   9
つのだ☆HIRO    8   16
aaaaaaaaaa  10  10
这是aaaaa一个测试 11  23
这是一个つの测试    8   24
于 2021-10-14T03:29:09.110 回答