繁体   English   中英

如何在Golang中将字符附加到字符串?

[英]How to append a character to a string in Golang?

如何在Go中将字符附加到字符串?

这不起作用:

s := "hello";
c := 'x'; 
fmt.Println(s + c);

无效操作:s + c(字符串和符文类型不匹配)

这也不起作用:

s := "hello";
c := 'x'; 
fmt.Println(s + rune(c));

无效操作:s + rune(c)(字符串和符文类型不匹配)

在 Go 中,符文类型不是字符类型,它只是 int32 的另一个名称。

如果您来自 Java 或类似语言,这会让您感到惊讶,因为 Java 具有 char 类型,您可以将 char 添加到字符串中。

String s = "hello";
char c = 'x';
System.out.println(s + c);

在 Go 中,您需要更加明确:

s := "hello";
c := 'x';
fmt.Println(s + string(c));

天哪,您真的需要将每个字符转换为字符串常量吗? 是的,但别担心,这只是因为类型系统和编译器正确优化了它。 在底层,Java 和 Go 都以相同的方式附加字符。

如果您认为额外的输入很糟糕,只需比较上面每个示例中string关键字出现的次数。 :)

额外信息:(技术细节)

在 Go 中,字符串不是符文序列,它们是utf-8编码的符文序列。 当你跨越一个字符串时,你会得到符文,但你不能简单地将符文附加到一个字符串上。 例如:欧元符号“€”是一个整数 0x20AC(这称为代码点)但是当你用 utf-8 编码欧元符号时,你会得到 3 个字节:0xE2 0x82 0xAC http://www.fileformat.info/info/unicode /char/20aC/index.htm

所以附加一个字符实际上是这样的:

s = append(s, encodeToUtf8(c)) // Go
s = append(s, encodeToUtf16(c)) // Java

请注意,编码是在编译时完成的。

utf-8 可以编码 1、2、3 或 4 个字节的字符。 utf-16 可以用 2 个或 4 个字节编码一个字符。

所以Go通常为中文附加1个字节(对于ascii)或2、3、4个字节,而Java通常为中文附加2个字节(对于ascii)或4个字节。

由于我们(西方)使用的大多数字符都可以用 2 个字节进行编码,Java 错误地认为字符串是 2 个字节的字符序列,这在您需要编码之前是正确的 美国必须死

简单但有点低效

虽然这对于一个简单的程序来说非常有效,但它的效率有点低。 因为 Go 中的字符串是不可变的,所以每次我们想要更改字符串或添加到字符串时,我们都会创建新的字符串。 对于我们需要将多个字符/字符串添加到字符串中的场景,那么它是低效的

s := "hello";
c := 'x';
fmt.Println(s + string(c));

使用strings.Builder (Go 1.10+)

Builder 用于使用 Write 方法有效地构建字符串。 它最大限度地减少了内存复制。 零值即可使用。 不要复制非零的 Builder。

    package main

    import (
      "strings"
      "fmt"
    )
    
    func main() {
        var s string
        s = "hello";
        var c = 'x';
        var sb strings.Builder
        sb.WriteString(s)
        sb.WriteRune(c)
        fmt.Println(sb.String())
    }

https://play.golang.org/p/n1plG9eOxHD

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM