浠液洛花 發表於 2021-8-4 07:35:00

Go语言常见的坑

<p>这里列举的Go语言常见坑都是符合Go语言语法的,可以正常的编译,但是可能是运行结果错误,或者是有资源泄漏的风险。</p>
<h3 id="1-可变参数是空接口类型">1. 可变参数是空接口类型</h3>
<p>当参数的可变参数是空接口类型时,传入空接口的切片时需要注意参数展开的问题。</p>
<pre><code class="language-go">package main

import "fmt"

func main() {
    var a = []interface{}{1, 2, 3}

    fmt.Println(a)
    fmt.Println(a...)
}

</code></pre>
<p>不管是否展开,编译器都无法发现错误,但是输出是不同的:</p>
<pre><code class="language-shell">
1 2 3
</code></pre>
<h3 id="2-数组是值传递">2. 数组是值传递</h3>
<p><strong>在函数调用参数中,数组是值传递,无法通过修改数组类型的参数返回结果。</strong></p>
<pre><code class="language-go">package main

import "fmt"

func main() {
        x := int{1, 2, 3}

        // 匿名函数, 传入数组, 尝试通过数组索引修改数组
        func(arr int) {
                arr = 7
                fmt.Println("arr:", arr)
        }(x)

        fmt.Println("x:", x)
}
</code></pre>
<p>输出:</p>
<pre><code class="language-shell">arr:
x:
</code></pre>
<p>必要时需要使用切片。</p>
<h3 id="3map遍历是顺序不固定">3.map遍历是顺序不固定</h3>
<p>map是一种hash表实现,每次遍历的顺序都可能不一样。</p>
<pre><code class="language-go">
package main


import "fmt"

func main(){
    m := mapint{
      "1":1,
      "2":2,
      "3":3,
    }
   
    // 遍历字典k,v
    for k, v := range m {
      fmt.Println(k, v)
    }
}
</code></pre>
<p>每次执行结果,输出都不一样<br>
输出:</p>
<pre><code class="language-shell">3 3
1 1
2 2
</code></pre>
<h3 id="4-返回值被屏蔽">4. 返回值被屏蔽</h3>
<p>在局部作用域中,命名的返回值内同名的局部变量屏蔽:</p>
<pre><code class="language-go">package main

import "fmt"

func Bar() error {
        return fmt.Errorf("func err Bar()... ")
}

func Foo() (err error) {
        if err := Bar(); err != nil {
                return
        }
        return
}

func main() {
        err := Foo()
        fmt.Printf("err is %v", err)
}
</code></pre>
<p>重新定义返回的变量名,导致输出错误, 输出</p>
<pre><code class="language-shell">D:\gopath\src\Go_base\lesson\someNots&gt;go run demo.go
# command-line-arguments
.\demo.go:11:3: err is shadowed during return
</code></pre>
<h3 id="5recover必须在defer函数中运行">5.recover必须在defer函数中运行</h3>
<ol>
<li>recover捕获的是祖父级调用时的异常,直接调用时无效:<pre><code class="language-go">package main

func main() {
        recover()
        panic(1)
}

</code></pre>
输出:<pre><code class="language-shell">panic: 1

goroutine 1 :
main.main()
      D:/gopath/src/Go_base/lesson/someNotes/recover1.go:5 +0x4e
exit status 2
</code></pre>
</li>
<li>直接defer调用也是无效:<pre><code class="language-go">package main

func main() {
        defer recover()
        panic(1)
}
</code></pre>
会提示:<pre><code class="language-shell">defer should not call recover() directly
</code></pre>
</li>
<li>defer调用时多层嵌套依然无效:<pre><code class="language-go">package main

func main() {
        // 第一层匿名函数
        defer func() {
                // 第二层
                func() {
                        recover()
                }()
        }()
        panic(1)
}
</code></pre>
</li>
</ol>
<p><strong>正确方式</strong>:<br>
必须在defer函数中直接调用才有效:</p>
<pre><code class="language-go">package main

import "fmt"

func main() {
        defer func() {
                err := recover()
                if err != nil {
                        fmt.Printf("err:%v", err)
                }
        }()
        panic(1)
}
</code></pre>
<h3 id="6-main函数提前退出">6. main函数提前退出</h3>
<p>后台Goroutine无法保证完成任务。</p>
<pre><code class="language-go">package main

func main() {
        go println("hello")
}
</code></pre>
<p>main函数相当于主线程, go启用单独的线程,无法满足 一致性</p>
<h3 id="7通过sleep来回避并发中的问题">7.通过Sleep来回避并发中的问题</h3>
<p>休眠并不能保证输出完整的字符串:</p>
<pre><code class="language-go">package main

import "time"

func main() {
        go func() {
                time.Sleep(time.Microsecond)
                println("hello, this is a goroutine")

        }()
        time.Sleep(time.Microsecond)
}
</code></pre>
<p>因为主线程于协程之间并不能满足一致性原则</p>
<h3 id="8独占cpu导致其它goroutine饿死">8.独占CPU导致其它Goroutine饿死</h3>
<p>Goroutine是协作式抢占调度,Goroutine本身不会主动放弃CPU:</p>
<pre><code class="language-go">package main

import (
        "fmt"
        "runtime"
)

func main() {
        runtime.GOMAXPROCS(1)

        go func() {
                for i := 0; i &lt; 10; i++ {
                        fmt.Println(i)
                }
        }()

        for {
        } // 占用CPU
}
</code></pre>
<p>结果会一直出于阻塞状态</p>
<p><strong>解决办法</strong></p>
<ol>
<li>
<p>解决的方法是在for循环加入runtime.Gosched()调度函数:</p>
<pre><code class="language-go">package main

import (
        "fmt"
        "runtime"
)

func main() {
        runtime.GOMAXPROCS(1)

        go func() {
                for i := 0; i &lt; 10; i++ {
                        fmt.Println(i)
                }
        }()

        for {
          // 调度函数
                runtime.Gosched()
        }
}
</code></pre>
</li>
<li>
<p>通过阻塞的方式避免CPU占用:</p>
<pre><code class="language-go">package main

import (
        "fmt"
        "os"
        "runtime"
)

func main() {
        runtime.GOMAXPROCS(1)

        go func() {
                for i := 0; i &lt; 10; i++ {
                        fmt.Println(i)
                }
                os.Exit(0)
        }()

        select {}
}
</code></pre>
</li>
</ol>
<h3 id="9-不同goroutine之间不满足顺序一致性内存模型">9. 不同Goroutine之间不满足顺序一致性内存模型</h3>
<p>因为在不同的Goroutine,main函数中无法保证能打印出hello, world:</p>
<pre><code class="language-go">package main

var msg string
var done bool

func setup() {
        msg = "hello, world"
        done = true
}

func main() {
        go setup()

        println(done)
        for !done {
        }
        println(msg)
}
</code></pre>
<p>输出:</p>
<pre><code class="language-shell">false
hello, world
</code></pre>
<p><strong>解决的办法</strong>:是用显式同步:</p>
<pre><code class="language-go">package main

import "fmt"

var msg string
var done = make(chan bool)

func setup() {
        msg = "hello, world"
        done &lt;- true
}

func main() {
        go setup()
        // 无缓冲通道,写入优先于读取,所以当通道无数据时,会一直进行阻塞
        d := &lt;-done
        fmt.Println(d)
        println(msg)
}
</code></pre>
<p>msg的写入是在channel发送之前,所以能保证打印hello, world</p>
<h3 id="10-闭包错误引用同一个变量">10. 闭包错误引用同一个变量</h3>
<pre><code class="language-go">package main

func main() {
        for i := 0; i &lt; 5; i++ {
          // defer会压栈,只会存储最后一个变量值
                defer func() {
                        println(i)
                }()
        }
}
</code></pre>
<p>输出:</p>
<pre><code class="language-shell">5
5
5
5
5
</code></pre>
<p><strong>改进:</strong></p>
<ol>
<li>
<p>在每轮迭代中生成一个局部变量</p>
<pre><code class="language-go">package main

func main() {
        for i := 0; i &lt; 5; i++ {
                i := i
                // 输出刚好相反, 压栈先进后出
                defer func() {
                        println(i)
                }()
        }
}
</code></pre>
</li>
<li>
<p>或者是通过函数参数传入:</p>
<pre><code class="language-go">package main

func main() {
        for i := 0; i &lt; 5; i++ {
                defer func(i int) {
                        println(i)
                }(i)
        }
}
</code></pre>
</li>
<li>
<p>输出:</p>
<pre><code class="language-shell">4
3
2
1
0
</code></pre>
</li>
</ol>
<h3 id="11-在循环内部执行defer语句">11. 在循环内部执行defer语句</h3>
<p>defer在*函数退出时才能执行**,所以直接在for循环内执行defer会导致资源延迟释放:</p>
<pre><code class="language-go">package main

import (
        "log"
        "os"
)

func main() {
        for i := 0; i &lt; 5; i++ {
                f, err := os.Open("/path/to/file")
                if err != nil {
                        log.Fatal(err)
                }
                // 会导致同时打开5个文档的操作句柄, 最后才会关闭
                defer f.Close()
        }
}
</code></pre>
<p><strong>解决的方法</strong>:<br>
在for中构造一个局部函数,在局部函数内部执行defer:</p>
<pre><code class="language-go">package main

import (
        "log"
        "os"
)

func main() {
        for i := 0; i &lt; 5; i++ {
          // 构建一个局部函数
                func() {
                        f, err := os.Open("/path/to/file")
                        if err != nil {
                                log.Fatal(err)
                        }
                        // 函数执行完毕后,就可以直接执行 close操作
                        defer f.Close()
                }()
        }
}
</code></pre>
<h3 id="12-切片会导致整个底层数组被锁定">12. 切片会导致整个底层数组被锁定</h3>
<p>切片会导致整个底层数组被锁定,底层数组无法释放内存。如果底层数组较大会对内存产生很大的压力。</p>
<pre><code class="language-go">package main

import (
        "io/ioutil"
        "log"
)

func main() {
        headerMap := make(map[]byte)

        for i := 0; i &lt; 5; i++ {
                name := "/path/to/file"
                // data是一个 byte数组
                data, err := ioutil.ReadFile(name)
                if err != nil {
                        log.Fatal(err)
                }
                // map赋值时,对数组进行了切片
                headerMap = data[:1]
        }

        // do some thing
}
</code></pre>
<p><strong>解决的方法</strong>: 将结果克隆一份,这样可以释放底层的数组:</p>
<pre><code class="language-go">package main

import (
        "io/ioutil"
        "log"
)

func main() {
        headerMap := make(map[]byte)

        for i := 0; i &lt; 5; i++ {
                name := "/path/to/file"
                data, err := ioutil.ReadFile(name)
                if err != nil {
                        log.Fatal(err)
                }
      
                // 将数组data切片后直接克隆一份儿
                headerMap = append([]byte{}, data[:1]...)
        }

        // do some thing
}
</code></pre>
<h3 id="13-空指针和空接口不等价">13. 空指针和空接口不等价</h3>
<p>比如返回了一个错误指针,但是并不是空的error接口:</p>
<pre><code class="language-go">func returnsError() error {
    var p *MyError = nil
    if bad() {
      p = ErrBad
    }
    return p // Will always return a non-nil error.
}
</code></pre>
<h3 id="14-内存地址会变化">14. 内存地址会变化</h3>
<p>Go语言中对象的地址可能发生变化,因此指针不能从其它非指针类型的值生成:</p>
<pre><code class="language-go">package main

import (
        "runtime"
        "unsafe"
)

func main() {
        var x int = 42
        // p 为x的指针
        var p uintptr = uintptr(unsafe.Pointer(&amp;x))

        runtime.GC()
        // 取地址
        var px *int = (*int)(unsafe.Pointer(p))
        println(*px)
}
</code></pre>
<p>当内存发送变化的时候,相关的指针会同步更新,但是非指针类型的uintptr不会做同步更新。</p>
<p>同理CGO中也不能保存Go对象地址。</p>
<h3 id="15goroutine泄露">15.Goroutine泄露</h3>
<p>Go语言是带内存自动回收的特性,因此内存一般不会泄漏。但是Goroutine确存在泄漏的情况,同时泄漏的Goroutine引用的内存同样无法被回收。</p>
<pre><code class="language-go">package main

import "fmt"

func main() {
        // 定义一个匿名函数, 返回一个只读int类型通
        ch := func() &lt;-chan int {
                // 定义一个无缓冲读写通道
                ch := make(chan int)
                // 协程用于向通道写入数据
                go func() {
                        for i := 0; ; i++ {
                                ch &lt;- i
                        }
                }()
                return ch
        }()

        // 遍历结果
        for v := range ch {
                fmt.Println(v)
                if v == 5 {
                        break
                }
        }
}
</code></pre>
<p>上面的程序中后台Goroutine向管道输入自然数序列,main函数中输出序列。但是当break跳出for循环的时候,后台Goroutine就处于无法被回收的状态了。</p>
<p><strong>解决方法:</strong> 可以通过context包来避免这个问题:</p>
<pre><code class="language-go">package main

import (
        "context"
        "fmt"
)

func main() {
        ctx, cancel := context.WithCancel(context.Background())

        ch := func(ctx context.Context) &lt;-chan int {
                ch := make(chan int)
                go func() {
                        for i := 0; ; i++ {
                                select {
                                case &lt;-ctx.Done():
                                        return
                                case ch &lt;- i:
                                }
                        }
                }()
                return ch
        }(ctx)

        for v := range ch {
                fmt.Println(v)
                if v == 5 {
                        cancel()
                        break
                }
        }
}
</code></pre>
<p>当main函数在break跳出循环时,通过调用cancel()来通知后台Goroutine退出,这样就避免了Goroutine的泄漏</p>
<h3 id="16-append错误使用导致无返回值">16. append错误使用导致无返回值</h3>
<p><code>append</code>的本质是向切片中追加数据,而随着切片中元素逐渐增加,当切片底层的数组将满时,切片会发生扩容.</p>
<p>如下:<br>
函数Validation()用于一些合法性检查,每遇到一个错误,就生成一个新的error并追加到切片errs中,<br>
最后返回包含所有错误信息的切片。<br>
为了简单起见,假定函数发现了三个错误,如下所示:</p>
<pre><code class="language-go">func Validatior() []error {
    var errors []error
   
    append(errs, errors.New("error 1")
    append(errs, errors.New("error 2")
    append(errs, errors.New("error 3")
}
</code></pre>
<p><em>函数Validation()有什么问题?</em></p>
<p>目前有很多的工具可以自动检查出类似的问题,比如GolandIDE就会给出很明显的提示。但是并不知道为何出错。</p>
<p>append每个追加元素,都有可能触发切片扩容,也即有可能返回一个新的切片,这也是append函数声明中返回值为切片的原因。实际使用中应该总是接收该返回值。</p>
<p>上述题目一中,由于初始切片长度为0,所以实际上每次append都会产生一个新的切片并迅速抛弃(被gc回收)。<br>
原始切片并没有任何改变。需要特别说明的是,不管初始切片长度为多少,不接收append返回都是有极大风险的。<br>
所以正确的方式如下:</p>
<pre><code class="language-go">func Validatior() []error {
    var errs []error
   
    errs=append(errs, errors.New("error 1")
    errr=append(errs, errors.New("error 2")
    errs=append(errs, errors.New("error 3")
}
</code></pre>
<h3 id="17-append-可以追加nil值">17. append 可以追加nil值</h3>
<p>函数<code>ValidateName()</code>用于检查某个名字是否合法,如果不为空则认为合法,否则返回一个error。<br>
类似的,还可以有很多检查项,比如检查性别、年龄等,我们统称为子检查项。<br>
函数<code>Validations()</code>用于收集所有子检查项的错误信息,将错误信息汇总到一个切片中返回。</p>
<p>请问函数<code>Validations()</code>有什么问题?</p>
<pre><code class="language-go">func ValidateName(name string) error {
    if name != "" {
      return nil
    }

    return errors.New("empty name")
}

func Validations(name string) []error {
    var errs []error

    errs = append(errs, ValidateName(name))

    return errs
}
</code></pre>
<p>向切片中追加一个nil值是完全不会报错的,如下代码所示:</p>
<pre><code class="language-go">slice := append(slice, nil)
</code></pre>
<p>经过追加后,slice的长度递增1。</p>
<p>实际上nil是一个预定义的值,即空值,所以完全有理由向切片中追加。</p>
<p>单纯从技术上讲是没有问题,但在使用场景中就有很大的问题。</p>
<p>比如你可能会根据切片的长度来判断是否有错误发生,比如</p>
<pre><code class="language-go">func foo() {
    errs := Validations("")

    if len(errs) &gt; 0 {
      println(errs)
      os.Exit(1)
    }
}
</code></pre>
<p>如果向切片中追加一个nil元素,那么切片长度则不再为0,程序很可能因此而退出,更糟糕的是,这样的切片是没有内容会打印出来的,这无疑又增加了定位难度.</p>
<h3 id="18-循环变量绑定">18. 循环变量绑定</h3>
<p>首先看下如下几种方式的代码:</p>
<ol>
<li>函数Process1()用于处理任务,每个任务均启动一个协程进行处理。</li>
</ol>
<pre><code class="language-go">func Process1(tasks []string) {
    for _, task := range tasks {
      // 启动协程并发处理任务
      go func() {
            fmt.Printf("Worker start process task: %s\n", task)
      }()
    }
}
</code></pre>
<p>2.函数Process2()用于处理任务,每个任务均启动一个协程进行处理。<br>
协程匿名函数接收一个任务作为参数,并进行处理。</p>
<pre><code class="language-go">func Process2(tasks []string) {
    for _, task := range tasks {
      // 启动协程并发处理任务
      go func(t string) {
            fmt.Printf("Worker start process task: %s\n", t)
      }(task)
    }
}
</code></pre>
<p>3.项目中经常需要编写单元测试,而单元测试最常见的是table-driven风格的测试,如下所示:<br>
待测函数很简单,只是计算输入数值的2倍值。</p>
<pre><code class="language-go">func Double(a int) int {
    return a * 2
}
</code></pre>
<p>测试函数如下:</p>
<pre><code class="language-go">func TestDouble(t *testing.T) {
    var tests = []struct {
      name         string
      input      int
      expectOutput int
    }{
      {
            name:         "double 1 should got 2",
            input:      1,
            expectOutput: 2,
      },
      {
            name:         "double 2 should got 4",
            input:      2,
            expectOutput: 4,
      },
    }

    for _, test := range tests {
      t.Run(test.name, func(t *testing.T) {
            if test.expectOutput != Double(test.input) {
                t.Fatalf("expect: %d, but got: %d", test.input, test.expectOutput)
            }
      })
    }
}
</code></pre>
<p>上述测试函数也很简单,通过设计多个测试用例,标记输入输出,使用子测试进行验证。</p>
<p><em>上述三个函数是否有问题?</em></p>
<h4 id="原理剖析">原理剖析</h4>
<p>有个共同点就是都引用了循环变量。即在<code>for index, value := range xxx</code>语句中,<br>
index和value便是循环变量。不同点是循环变量的使用方式,有的是直接在协程中引用(1),有的作为参数传递(2),而3则是兼而有之。</p>
<p>回答以上问题,记住以下两点即可。</p>
<h4 id="1循环变量是易变的">1.循环变量是易变的</h4>
<p>首先,循环变量实际上只是一个普通的变量。</p>
<p>语句<code>for index, value := range xxx</code>中,每次循环<code>index</code>和<code>value</code>都会被重新赋值(并非生成新的变量)。</p>
<p><strong>如果循环体中会启动协程(并且协程会使用循环变量),就需要格外注意了,因为很可能循环结束后协程才开始执行</strong> ,<br>
此时,所有协程使用的循环变量有可能已被改写。(是否会改写取决于引用循环变量的方式)</p>
<h4 id="2-虚幻变量需要绑定">2. 虚幻变量需要绑定</h4>
<p>1.(1)中,协程函数体中引用了循环变<code>task</code>,协程从被创建到被调度执行期间循环变量极有可能被改写,这种情况下,我们称之为变量没有绑定。函数1 打印结果是混乱的。很有可能(随机)所有协程执行的task都是列表中的最后一个task。</p>
<ol start="2">
<li>
<p>函数2中,协程函数体中并没有直接引用循环变量<code>task</code>,而是使用的参数。而在创建协程时,循环变量<code>task</code><br>
作为函数参数传递给了协程。<strong>参数传递的过程实际上也生成了新的变量,也即间接完成了绑定</strong>。<strong>所以,题目二实际上是没有问题的。</strong></p>
</li>
<li>
<p>测试函数3 ,测试用例名字<code>test.name</code>通过函数参数完成了绑定,而<code>test.input</code> 和 <code>test.expectOutput</code>则没有绑定。然而题目三实际执行却不会有问题,因为t<code>.Run(...)</code>并不会启动新的协程,也就是<strong>循环体并没有并发。此时,即便循环变量没有绑定也没有问题。</strong></p>
<p>但是风险在于,如果t.Run(...)执行的测试体有可能并发(比如通过t.Parallel()),此时就极有可能引入问题。</p>
</li>
</ol>
<p>对于3中的测试用例,建议显式地绑定,例如:</p>
<pre><code class="language-go">    for _, test := range tests {
      tc := test // 显式绑定,每次循环都会生成一个新的tc变量
      t.Run(tc.name, func(t *testing.T) {
            if tc.expectOutput != Double(tc.input) {
                t.Fatalf("expect: %d, but got: %d", tc.input, tc.expectOutput)
            }
      })
    }
</code></pre>
<p>通过tc := test显式地绑定,每次循环会生成一个新的变量。</p>
<h4 id="3总结">3.总结</h4>
<p>简单点来说</p>
<ul>
<li>如果循环体没有并发出现,则引用循环变量一般不会出现问题;</li>
<li>如果循环体有并发,则根据引用循环变量的位置不同而有所区别
<ul>
<li>通过参数完成绑定,则一般没有问题;</li>
<li>函数体中引用,则需要显式地绑定</li>
</ul>
</li>
</ul>
<h3 id="不定期更新">不定期更新</h3>
<p>...</p>


</div>
<div id="MySignature" role="contentinfo">
    ♥永远年轻,永远热泪盈眶♥<br><br>
来源:https://www.cnblogs.com/failymao/p/15097197.html
頁: [1]
查看完整版本: Go语言常见的坑