08Go字符串详解

时间 2021-06-11 标签正则表达式数组函数学习编码指针 code 索引内存 utf-8

Go字符串详解

总结:正则表达式

字符串是不可变值类型，内部⽤指针指向 UTF-8 字节数组。
默认值是空字符串 ""。
⽤索引号访问某字节，如 s[i]。取出的是字节，不是字符
不能⽤序号获取字节元素指针， &s[i] ⾮法。
不可变类型，⽆法修改字节数组。使用[]rune进行修改是从新分配内存，并复制字节数组
字符串能够用==和<进行比较；
go语言的字符串是utf-8的定长字符序列，会自动转为Unicode，而后能够经过[]rune按索引取出字符。

一、字符串的定义

在Go语言中，字符串字面量使用双引号 "" 或者反引号 ' 来建立。数组

双引号用来建立可解析的字符串，支持转义，但不能用来引用多行；
反引号用来建立原生的字符串字面量，可能由多行组成，但不支持转义，而且能够包含除了反引号外其余全部字符。
双引号建立可解析的字符串应用最普遍，反引号用来建立原生的字符串则多用于书写多行消息，HTML以及正则表达式。

s:="今天很开心"
s:=`今天开心吗
    不开心啊
        真的？`

二、字符串操做

(1)字符串支持 + 链接操做和+=追加操做

链接跨⾏字符串时， "+" 必须在上⼀⾏末尾，不然致使编译错误。
s := "Hello, " +
    "World!"
s2 := "Hello, "
    + "World!"   // Error: invalid operation: + untyped string

s+="abc"

其余函数链接这里暂不说明函数

(2)⽀持⽤两个索引号返回⼦串。⼦串依然指向原字节数组，仅修改了指针和⻓度属性。

s := "Hello, World!"
s1 := s[:5] // Hello
s2 := s[7:] // World!
s3 := s[1:5] // ello

注意：若是字符串中有汉字，汉字占得就是3个字节，因此就不必定能取出学习

(3)字符串底层分析

struct String{//字符串是个不可变值类型， 存储了字节和长度
    byte* str;
    intgo len;
};

字符串是 UTF-8 字符的一个序列（当字符为 ASCII 码时则占用 1 个字节，其它字符根据须要占用 2-4 个字节）编码

go语言中字符串的字节使用UTF-8编码表示Unicode文本。所以Go语言字符串是变宽字符序列，每个字符都用一个或者多个字符表示，这跟其余的（C++，Java，Python 3）的字符串类型有着本质上的不一样，后者为定宽字符序列。指针

每个Unicode字符都有一个惟一的叫作“码点”的标识数字。在Go语言中，一个单一的码点在内存中以 rune 的形式表示，rune表示int32类型的别名。能够将Go语言的字符串转化为Unicode码点切片（类型为 [ ]rune），切片是支持直接索引的。code

package main
import(
    "fmt"
)
func main() {
    s:="abc好好学习"
    fmt.Println(s)
    for _,b:=range []byte(s){
        fmt.Printf("%x ",b) //打印16进制
    }
    fmt.Println("\n字节长度：",len(s))
    
    for i,ch:=range s{ //ch 是rune  int32别名4个字节
        fmt.Printf("(%d %x)",i,ch)
    }
    fmt.Println()
    for i,ch:=range []rune(s){
        fmt.Printf("(%d %c)",i,ch)
    }
}
//输出结果
abc好好学习
61 62 63 e5 a5 bd e5 a5 bd e5 ad a6 e4 b9 a0 
字节长度： 15
(0 61)(1 62)(2 63)(3 597d)(6 597d)(9 5b66)(12 4e60)
(0 a)(1 b)(2 c)(3 好)(4 好)(5 学)(6 习)

上面代码显示,咱们把字符串转为[]bype数组，打印出utf-8的字节，能够看到“学”这个汉字占了e5 ad a6三个16进制字节。看到一个汉字占3个字节，一个英文字母占1个字节，utf-8是可变宽度。索引

遍历s,取出的是Unicode码，能够看到“学”这个汉字的Unicode是 5b66，它是从第9个开始的，(9 5b66)。内存

将字符串转为[]rune 也就是int32的别名，占4个字节。打印出了abc好好学习。utf-8

说明：go语言的字符串是utf-8的定长字符序列，会自动转为Unicode，而后能够经过[]rune按索引取出字符。

三、String包的使用

查找操做
func Contains(s, substr string) bool
func Index(s, sep string) int
func Count(s, sep string) int
重复操做
func Repeat(s string, count int) string
替换操做
func Replace(s, old, new string, n int) string
删除操做
func Trim(s string, cutset string) string
大小写转换
func Title(s string) string
func ToLower(s string) string
func ToUpper(s string) string
字符串前缀后缀
func HasPrefix(s, prefix string) bool
func HasSuffix(s, suffix string) bool
字符串分割
func Split(s, sep string) []string
func Fields(s string) []string

查找操做

判断给定字符串s中是否包含子串substr, 找到返回true, 找不到返回false

func Contains(s, substr string) bool

实例以下：

package main

import (
    "fmt"
    "strings"
)

func main() {
    fmt.Println("包含子串返回：", strings.Contains("oldboy", "boy"))
    fmt.Println("不包含子串返回：", strings.Contains("oldboy", "girl"))
    fmt.Println("子字符串是空字符串返回：", strings.Contains("hello", ""))
    fmt.Println("原字符串、子字符串都是空字符串返回：", strings.Contains("", ""))
    fmt.Println("中文字符串包含子串返回：", strings.Contains("我很帅", "帅"))
}

运行结果：

包含子串返回： true
不包含子串返回： false
子字符串是空字符串返回： true
原字符串、子字符串都是空字符串返回： true
中文字符串包含子串返回： true

在字符串s中查找sep所在的位置, 返回位置值, 找不到返回-1

func Index(s, sep string) int

实例以下：

package main

import (
    "fmt"
    "strings"
)

func main() {
    fmt.Println("存在返回第一个匹配字符的位置：", strings.Index("heloboy", "boy"))
    fmt.Println("不存在返回：", strings.Index("helo", "day"))
    fmt.Println("中文字符串存在返回：", strings.Index("我很帅", "很帅"))
}

运行结果：

存在返回第一个匹配字符的位置： 4
不存在返回： -1
中文字符串存在返回： 3    //这里是按照字节的顺序返回 一个汉字是3个字节，因此这个是从索引为3的开始

统计给定子串sep的出现次数, sep为空时, 返回字符串的长度 + 1

func Count(s, sep string) int

实例以下：

package main

import (
    "fmt"
    "strings"
)
func main() {
    fmt.Println("子字符串出现次数：", strings.Count("hello world", "o"))
    fmt.Println("子字符串为空时, 返回：", strings.Count("hello", ""))
}

运行结果：

子字符串出现次数： 2
子字符串为空时, 返回： 6

重复操做

重复s字符串count次, 最后返回新生成的重复的字符串

func Repeat(s string, count int) string

实例以下：

package main

import (
    "fmt"
    "strings"
)

func main() {
    fmt.Println(strings.Repeat("嘀嗒", 4), "时针它不停在转动")
}

运行结果：

嘀嗒嘀嗒嘀嗒嘀嗒 时针它不停在转动

替换操做

在s字符串中, 把old字符串替换为new字符串，n表示替换的次数，若是n<0会替换全部old子串。

func Replace(s, old, new string, n int) string

实例以下：

package main

import (
    "fmt"
    "strings"
)

func main() {
    fmt.Println(strings.Replace("hel hel hel", "l", "llo", 2))
    fmt.Println(strings.Replace("hel hel hel", "l", "llo", -1))
}

运行结果：

hello hello hel
hello hello hello

删除操做

删除在s字符串的头部和尾部中由cutset指定的字符, 并返回删除后的字符串

func Trim(s string, cutset string) string

实例以下：

package main

import (
    "fmt"
    "strings"
)

func main() {
    fmt.Println(strings.Trim("   hello   ", " "))
}

运行结果：

hello

大小写转换

给定字符串转换为英文标题的首字母大写的格式(不能正确处理unicode标点)

func Title(s string) string

返回将全部字母都转为对应的小写版本的拷贝

func ToLower(s string) string

返回将全部字母都转为对应的大写版本的拷贝

func ToUpper(s string) string

实例以下：

package main

import (
    "fmt"
    "strings"
)

func main() {
    fmt.Println(strings.Title("It is never too late to learn."))
    fmt.Println(strings.ToLower("It Is Never Too Late To Learn."))
    fmt.Println(strings.ToUpper("It is never too late to learn."))
}

运行结果：

It Is Never Too Late To Learn.
it is never too late to learn.
IT IS NEVER TOO LATE TO LEARN.

字符串前缀后缀

判断字符串是否包含前缀prefix，大小写敏感

func HasPrefix(s, prefix string) bool

判断s是否有后缀字符串suffix，大小写敏感

func HasSuffix(s, suffix string) bool

实例以下：

package main

import (
    "fmt"
    "strings"
)

func main() {
    fmt.Println("前缀是以hello开头的：", strings.HasPrefix("helloworld", "hello"))
    fmt.Println("后缀是以world开头的：", strings.HasSuffix("helloworld", "world"))
}

运行结果：

前缀是以hello开头的： true
后缀是以world开头的： true

字符串分割

用去掉s中出现的sep的方式进行分割，会分割到结尾，并返回生成的全部片断组成的切片（每个sep都会进行一次切割，即便两个sep相邻，也会进行两次切割）。若是sep为空字符，Split会将s切分红每个unicode码值一个字符串。

func Split(s, sep string) []string

返回将字符串按照空白（unicode.IsSpace肯定，能够是一到多个连续的空白字符）分割的多个字符串。若是字符串所有是空白或者是空字符串的话，会返回空切片。

func Fields(s string) []string

实例以下：

//若是要分割的字符串位于字符串两端，会多出一个空字符串

package main

import (
    "fmt"
    "strings"
)

func main() {
    fmt.Println("Split 函数的用法")
    fmt.Printf("%q\n", strings.Split("Linux,Python,Golang,Java", ","))
    fmt.Printf("%q\n", strings.Split("a mountain a temple", "a "))
    fmt.Printf("%q\n", strings.Split(" abc ", ""))
    fmt.Printf("%q\n", strings.Split("", "oldboy"))
    fmt.Println("Fields 函数的用法")
    fmt.Printf("Fields are: %q\n", strings.Fields(" Linux Python Golang  Java "))
}

运行结果：

Split 函数的用法
["Linux" "Python" "Golang" "Java"]
["" "mountain " "temple"]    
[" " "a" "b" "c" " "]
[""]
Fields 函数的用法
Fields are: ["Linux" "Python" "Golang" "Java"]