如何将字节缓冲区中以 null 结尾的字符串转换为 Go 中的字符串？

Question

这个：

label := string([]byte{97, 98, 99, 0, 0, 0, 0})
fmt.Printf("%s\n", label)

这样做（ ^@是空字节）：

go run test.go 
abc^@^@^@

Answer 1

请注意，第一个答案仅适用于在null终止符后仅运行零的字符串; 但是，一个正确的C风格的以null结尾的字符串在第一个\\0结尾，即使它后面跟着垃圾。 例如， []byte{97,98,99,0,99,99,0}应解析为abc ，而不是abc^@cc 。

要正确解析它，请使用string.Index ，如下所示，找到第一个 \\0并使用它来切片原始字节切片：

package main

import (
    "fmt"
    "strings"
)

func main() {
    label := []byte{97,98,99,0,99,99,0}
    nullIndex := strings.Index(string(label), "\x00")
    if (nullIndex < 0) {
        fmt.Println("Buffer did not hold a null-terminated string")
        os.Exit(1)
    }
    fmt.Println(string(label[:nullIndex]))
}

编辑：将缩短版本打印为[]byte而不是string 。 感谢@serbaut的捕获。

编辑2：没有处理没有空终止符的缓冲区的错误情况。 感谢@snap的捕获。

Answer 2

在Go的syscall包中隐藏了这个函数，它找到第一个空字节（[] byte {0}）并返回长度。 我假设它被称为C-Length的clen。

对不起，我对这个答案迟了一年，但我觉得它比其他两个要简单得多（没有不必要的进口等）

func clen(n []byte) int {
    for i := 0; i < len(n); i++ {
        if n[i] == 0 {
            return i
        }
    }
    return len(n)
}

所以，

label := []byte{97, 98, 99, 0, 0, 0, 0}
s := label[:clen(label)]
fmt.Println(string(s))

^所说的是将s设置为从开头到clen(label)索引的label的字节切片。

结果将是abc ，长度为3。

Answer 3

使用strings包。

package main

import (
    "fmt"
    "strings"
)

func main() {
    label := string([]byte{97, 98, 99, 0, 0, 0, 0})
    fmt.Println(strings.TrimSpace(label))
}

Answer 4

您可以使用sys package：

package main
import "golang.org/x/sys/windows"

func main() {
   b := []byte{97, 98, 99, 0, 0, 0, 0}
   s := windows.ByteSliceToString(b)
   println(s == "abc")
}

或者你可以自己实现它：

package main
import "bytes"

func byteSliceToString(s []byte) string {
   n := bytes.IndexByte(s, 0)
   if n >= 0 {
      s = s[:n]
   }
   return string(s)
}

func main() {
   b := []byte{97, 98, 99, 0, 0, 0, 0}
   s := byteSliceToString(b)
   println(s == "abc")
}

Answer 5

在 go 1.18+ 中，您可以使用bytes.Cut ：

import (
    "bytes"
)

func bytesToStr(in []byte) string {
    str, _, _ := bytes.Cut(in, []byte{0})
    return string(str)
}

Answer 6

一. 字符串 .TrimSpace .TrimRight

//修剪尾部'\0'，但不能处理像“abc\x00def\x00”这样的字节。

无法编辑@orelli 答案，所以在这里写道：

package main

import (
    "fmt"
    "strings"
)

func main() {
    label := string([]byte{97, 98, 99, 0, 0, 0, 0})

    s1 := strings.TrimSpace(label)
    fmt.Println(len(s1), s1)

    s2 := strings.TrimRight(label, "\x00")
    fmt.Println(len(s2), s2)
  }

output：

7 abc????
3 abc

//? 是 '\0' ，此处无法显示。

所以
.TrimSpace不能修剪 '\0'，但是
.TrimRight加上 "\x00" 即可。

二. bytes.IndexByte

搜索第一个 '\0'，可能不支持 utf-8

package main

import (
    "bytes"
    "fmt"
    "strings"
)

func main() {
    b_arr := []byte{97, 98, 99, 0, 100, 0, 0}
    label := string(b_arr)

    s1 := strings.TrimSpace(label)
    fmt.Println(len(s1), s1)   //7 abc?d??

    s2 := strings.TrimRight(label, "\x00")
    fmt.Println(len(s2), s2)   //5 abc?d

    n := bytes.IndexByte([]byte(label), 0)
    fmt.Println(n, label[:n])  //3 abc

    s_arr := b_arr[:bytes.IndexByte(b_arr, 0)]
    fmt.Println(len(s_arr), string(s_arr)) //3 abc
}

相等的

n1 := bytes.IndexByte(b_arr, 0)
n2 := bytes.Index(b_arr, []byte{0})

n3, c := 0, byte(0)
for n3, c = range b_arr {
    if c == 0 {
        break
    }
}

Answer 7

第一个答案是行不通的!!

func TrimSpace(s []byte) []byte {
    return TrimFunc(s, unicode.IsSpace)
}

func IsSpace(r rune) bool {
    // This property isn't the same as Z; special-case it.
    if uint32(r) <= MaxLatin1 {
        switch r {
        case '\t', '\n', '\v', '\f', '\r', ' ', 0x85, 0xA0:
            return true
        }
        return false
    }
    return isExcludingLatin(White_Space, r)
}

func IsSpace中根本没有“\\ x00”。

如何将字节缓冲区中以 null 结尾的字符串转换为 Go 中的字符串？

问题描述

5 个解决方案

解决方案1
11 2012-09-11 20:36:22

解决方案2
9 已采纳 2015-01-08 07:19:24

解决方案3
5 2012-09-10 21:34:40

解决方案4
1 2021-04-22 18:08:19

解决方案5
0 2022-08-29 23:50:18

解决方案6
0 2022-09-01 15:05:02

一. 字符串 .TrimSpace .TrimRight

二. bytes.IndexByte

解决方案7
-1 2017-03-24 06:42:23

如何将字节缓冲区中以 null 结尾的字符串转换为 Go 中的字符串？

问题描述

5 个解决方案

解决方案1 11 2012-09-11 20:36:22

解决方案2 9 已采纳 2015-01-08 07:19:24

解决方案3 5 2012-09-10 21:34:40

解决方案4 1 2021-04-22 18:08:19

解决方案5 0 2022-08-29 23:50:18

解决方案6 0 2022-09-01 15:05:02

一. 字符串 .TrimSpace .TrimRight

二. bytes.IndexByte

解决方案7 -1 2017-03-24 06:42:23

解决方案1
11 2012-09-11 20:36:22

解决方案2
9 已采纳 2015-01-08 07:19:24

解决方案3
5 2012-09-10 21:34:40

解决方案4
1 2021-04-22 18:08:19

解决方案5
0 2022-08-29 23:50:18

解决方案6
0 2022-09-01 15:05:02

解决方案7
-1 2017-03-24 06:42:23