专栏名称: GoCN
最具规模和生命力的 Go 开发者社区
目录
相关文章推荐
河南新闻广播  ·  胖东来,新动作来了! ·  12 小时前  
河南新闻广播  ·  阳光正在赶来!河南即将开启升温模式 ·  昨天  
河南发布  ·  阳光正在赶来!河南即将开启升温模式 ·  昨天  
河南新闻广播  ·  蜜雪冰城今起招股,预计3月3日挂牌上市 ·  2 天前  
51好读  ›  专栏  ›  GoCN

Go 并发控制:sync.Once 详解

GoCN  · 公众号  ·  · 2024-11-12 15:03

正文

在 Go 语言的并发编程中,常常会遇到需要确保某个操作仅执行一次的场景。 sync.Once 是 Go 标准库中的一个简单而强大的工具,专门用于解决这种需求。本文将深入解析 sync.Once 的使用方法和原理,帮助你更好地理解 sync.Once 在并发控制中的用法。

sync.Once

sync.Once 是 Go 语言 sync 包中的一种同步原语。它可以确保一个操作(通常是一个函数)在程序的生命周期中 只被执行一次 ,不论有多少 goroutine 同时调用该操作,这就保证了并发安全。

根据 sync.Once 的特点,很容易想到它的几种常见使用场景:

  • 单例模式 :确保某个对象或配置仅初始化一次,例如使用单例模式初始化数据库连接池、配置文件加载等。
  • 懒加载 :在需要时才加载某些资源,且保证它们只会加载一次。
  • 并发安全的初始化 :当初始化过程涉及多个 goroutine 时,使用 sync.Once 保证初始化函数不会被重复调用。

快速上手

sync.Once 用法非常简单,示例如下:

package main

import (
 "fmt"
 "sync"
)

func main() {
 var once sync.Once
 onceBody := func() {
  fmt.Println("Only once")
 }
 done := make(chan bool)
 for i := 0; i < 10; i++ {
  go func() {
   once.Do(onceBody)
   done <- true
  }()
 }
 for i := 0; i < 10; i++ {
  <-done
 }
}

首先使用 var once sync.Once 声明了一个 sync.Once 类型的变量 once ,但不必显式初始化,这也是 sync 下很多包的惯用法。

然后定义了一个函数 onceBody ,接着启动 10 个 goroutine 并发调用 once.Do(onceBody) ,最终等待所有 goroutine 执行结束并退出。

执行示例代码,得到如下输出:

$ go run once/main.go 
Only once

和预期一样, once.Do 能够保证传递给它的函数 onceBody 只被执行一次。

其实就算不启用多个 goroutine,直接在主 goroutine 中调用多次 once.Do(onceBody) ,也能保证只执行一次:

package main

import (
 "fmt"
 "sync"
)

func main() {
 var once sync.Once
 onceBody := func() {
  fmt.Println("Only once")
 }
 for i := 0; i < 10; i++ {
  once.Do(onceBody)
 }
}

执行示例代码,得到如下输出:

$ go run once/main.go 
Only once

执行结果也是一样的,仅会执行一次。

至此,我们就学会了如何使用 sync.Onec 。以上就是 sync.Onec 提供的全部 API 了,没错它仅对外暴露了一个 Do 方法。

现在,我想你应该知道如何使用 sync.Onec 来实现单例模式了,我在另一篇文章《Go 常见设计模式之单例模式》(https://jianghushinian.cn/2022/03/04/Golang-常见设计模式之单例模式/)中也有讲解。

详细介绍

我们快速上手了 sync.Onec 的使用方法,下面我们来看下 Go 官方是如何介绍 sync.Onec 的。

Go 官方文档 对 sync.Once 的介绍只有简单三句话:

Once is an object that will perform exactly one action.

A Once must not be copied after first use.

In the terminology of the Go memory model , the return from f “synchronizes before” the return from any call of once.Do(f).

意思是说:

Once 是一个对象,它会确保某个操作 只执行一次

在首次使用后,Once 对象 不能被复制

根据 Go 内存模型的术语,f 函数的返回 " synchronizes before " 于 once.Do(f) 的任何调用返回。

首先第一句话中所说的 只执行一次 的特性我们已经见识过了。

对于第二句话中的 Once 对象 不能被复制 ,其实 sync 中很多对象都有这个特性,在我们稍后阅读源码时会有体现。

而第三句话不太好理解,实际上它想表达的是,在使用 sync.Once Do 方法执行 f 函数后, f 的结果会对所有调用 once.Do(f) 的其他 goroutine 可见。这种“先行发生”(synchronizes before)的保证意味着, f 的执行结果会在所有调用 once.Do(f) 的 goroutine 中同步,因此所有 goroutine 都能获得一致的结果。

具体来说:

  • f 函数在一个 goroutine 中被 once.Do(f) 首次调用时, f 会执行,并保证它的 效果 在内存中对其他 goroutine 可见。
  • 之后的所有 once.Do(f) 调用都不会重新执行 f ,但它们会“同步” f 的结果,确保 f 的结果已经生效,并对调用它们的 goroutine 可见。

这样, sync.Once 可以在多 goroutine 场景中安全地执行初始化等需要确保一次性操作的函数,而无需担心数据不一致的问题。

此外我们还需要注意一点, once.Do(f) 接收的函数 f 是没有返回值,所以所说 f 函数的执行的 效果 是指它执行的 副作用

如下示例就是利用 f 函数执行的副作用来修改变量 i 的值:

package main

import (
 "fmt"
 "sync"
)

func main() {
 var once sync.Once
 var i = 10
 onceBody := func() {
  i *= 2
 }
 done := make(chan bool)
 for i := 0; i < 10; i++ {
  go func() {
   once.Do(onceBody)
   done <- true
  }()
 }
 for i := 0; i < 10; i++ {
  <-done
 }
 fmt.Println("i", i)
}

执行示例代码,得到如下输出:

$ go run once/main.go
i 20

f 函数对变量 i 的值影响仅有一次。

源码解读

接下来我们再来看下 sync.Onec 源码,学习下它是如何实现的:

https://github.com/golang/go/blob/go1.23.0/src/sync/once.go

// Copyright 2009 The Go Authors. All rights reserved.
// Use of this source code is governed by a BSD-style
// license that can be found in the LICENSE file.

package sync

import (
 "sync/atomic"
)

// Once is an object that will perform exactly one action.
//
// A Once must not be copied after first use.
//
// In the terminology of [the Go memory model],
// the return from f “synchronizes before”
// the return from any call of once.Do(f).
//
// [the Go memory model]: https://go.dev/ref/mem
type Once struct {
 // done indicates whether the action has been performed.
 // It is first in the struct because it is used in the hot path.
 // The hot path is inlined at every call site.
 // Placing done first allows more compact instructions on some architectures (amd64/386),
 // and fewer instructions (to calculate offset) on other architectures.
 done atomic.Uint32
 m    Mutex
}

// Do calls the function f if and only if Do is being called for the
// first time for this instance of [Once]. In other words, given
//
// var once Once
//
// if once.Do(f) is called multiple times, only the first call will invoke f,
// even if f has a different value in each invocation. A new instance of
// Once is required for each function to execute.
//
// Do is intended for initialization that must be run exactly once. Since f
// is niladic, it may be necessary to use a function literal to capture the
// arguments to a function to be invoked by Do:
//
// config.once.Do(func() { config.init(filename) })
//
// Because no call to Do returns until the one call to f returns, if f causes
// Do to be called, it will deadlock.
//
// If f panics, Do considers it to have returned; future calls of Do return
// without calling f.
func (o *Once) Do(f func()) {
 // Note: Here is an incorrect implementation of Do:
 //
 // if o.done.CompareAndSwap(0, 1) {
 //  f()
 // }
 //
 // Do guarantees that when it returns, f has finished.
 // This implementation would not implement that guarantee:
 // given two simultaneous calls, the winner of the cas would
 // call f, and the second would return immediately, without
 // waiting for the first's call to f to complete.
 // This is why the slow path falls back to a mutex, and why
 // the o.done.Store must be delayed until after f returns.

 if o.done.Load() == 0 {
  // Outlined slow-path to allow inlining of the fast-path.
  o.doSlow(f)
 }
}

func (o *Once) doSlow(f func()) {
 o.m.Lock()
 defer o.m.Unlock()
 if o.done.Load() == 0 {
  defer o.done.Store(1)
  f()
 }
}

嗯,你没看错 sync.Onec 的源码竟然如此简单,算上全部的注释和空行,也才仅有 78 行代码,而注释占了一大半行数。

首先来看 Once 结构体的定义:






    
type Once struct {
 // done 指示操作是否已执行。
 // 它在结构体中位于首位(即第一个字段),因为它用于 hot path。
 // hot path 在每个调用点都进行了内联。
 // 将 done 放在首位在某些架构(如 amd64 和 386)上允许生成更紧凑的指令,
 // 而在其他架构上减少了指令数量(用于计算偏移量)。
 done atomic.Uint32
 m    Mutex
}

Once 结构体有两个属性, done 属性上的注释告诉我们它是有意被放在结构体第一个字段的,在某些架构能够减少 CPU 执行的指令数,以优化性能,作为 hot path

关于为什么放在结构体第一个字段就能优化性能,简单一句话来解释就是,第一个字段与结构体本身的指针地址是相同的,访问 Once 结构体无需指针偏移操作,就可以直接操作 done 属性。 hot path 更多解释的细节,我在另一篇文章 《Go 语言中的结构体内存对齐你了解吗?》 中有所讲解,你可以跳转过去查看。

另外 done 属性是 atomic.Uint32 类型,我们顺便来看下 atomic.Uint32 是如何定义的:

// A Uint32 is an atomic uint32. The zero value is zero.
type Uint32 struct {
 _ noCopy
 v uint32
}

// noCopy may be added to structs which must not be copied
// after the first use.
//
// See https://golang.org/issues/8005#issuecomment-190753527
// for details.
//
// Note that it must not be embedded, due to the Lock and Unlock methods.
type noCopy struct{}

// Lock is a no-op used by -copylocks checker from `go vet`.
func (*noCopy) Lock()   {}
func (*noCopy) Unlock() {}

这里有一个特殊字段 _ noCopy ,标识这个结构体不可复制,所以这也就是为什么前文中提到 Once 对象 不能被复制 的原因了。

使用 noCopy 字段来标识结构体不可复制,是 Go 语言中的惯用法,我在另一篇文章 《Go 中空结构体惯用法,我帮你总结全了!》 中有讲解。

Once 结构体的 n 属性没什么好说的,就是一个互斥锁 Mutex

接下来看 Do 方法的实现:

func (o *Once) Do(f func()) {
 // 注意:以下是一个错误的 Do 实现:
 //
 // if o.done.CompareAndSwap(0, 1) {
 //  f()
 // }
 //
 // Do 保证当它返回时,f 已完成。
 // 上述实现不满足该保证:
    // 给定有两个同时调用的情况,谁取得了 CompareAndSwap 就会执行 f,
    // 而第二个调用会立即返回,而不会等待第一个调用的 f 完成。
 // 这就是为什么慢路径需要退回到使用互斥锁 Mutex,
 // 并且为什么 o.done.Store 必须延迟到 f 返回之后。
 
 if o.done.Load() == 0 {
  // 慢路径(slow-path)分离,以允许对快路径(fast-path)进行内联。
  o.doSlow(f)
 }
}

func (o *Once) doSlow(f func()) {
 o.m.Lock()
 defer o.m.Unlock()
 if o.done.Load() == 0 {
  defer o.done.Store(1)
  f()
 }
}

可以看到, Do 方法内部还通过注释贴心的解释了为什么不使用 o.done.CompareAndSwap(0, 1) 的实现,而是使用 o.done.Load() + Mutex 的实现。

Do 方法处理两种 case ,先是 if o.done.Load() == 0 的判断,这是一个 fast-path ,如果成立,则调用 o.doSlow(f) 进入 slow-path ,否则 fast-path 执行结束直接返回了。

这里简单解释下 fast-path slow-path

  • fast-path :一段针对常见操作或最佳情况进行优化的代码路径。在这条路径上,通常执行步骤最少、效率最高。所以 fast path 通常在设计上避免了昂贵的操作(如 加锁 、IO 操作等)以提高性能。
  • ** slow-path **:用于处理较为罕见或复杂的情况,通常执行步骤较多、性能较低。这类路径通常在少数情况下才会被执行,比如当代码需要处理边缘情况或复杂的操作时。

所以说, Do 方法绝大多数情况下都会通过 fast-path 直接返回,只有第一次调用才会进入 o.doSlow(f) 逻辑。

doSlow 方法内部,先加锁,然后再一次检查了 if o.done.Load() == 0 。很明显这是一个 Double-Check Locking ,保证极端情况下的并发安全。我在《Go 常见设计模式之单例模式》中有讲解如何使用 Double-Check Locking 来实现单例模式,感兴趣的读者可以跳转过去查看。

现在, sync.Once 的源码就都解读完成了。

当然,细心的读者可能注意到,注释中其实写了为什么要将 slow-path 分离出来,单独定义一个函数,目的是为了对 fast-path 进行内联优化。

slow-path 逻辑放在单独的 doSlow 函数中可以使 Do 方法的快路径更简洁,这样还有助于 Go 编译器对 fast-path 进行 内联优化 (即直接嵌入到调用处),从而减少函数调用的开销,提高性能。

我们可以来验证一下内联是否生效,示例代码如下:

package once

import "sync"

func main() {
 var once sync.Once
 once.Do(func() {
  println("Only once")
 })
}

执行 go build 时传入 -gcflags='-m' 构建参数可以查看内联情况:

$ go build -gcflags='-m' inlining/once/main.go  
# command-line-arguments
inlining/once/main.go:7:10: can inline main.func1
inlining/once/main.go:7:9: inlining call to sync.(*Once).Do
inlining/once/main.go:7:9: inlining call to atomic.(*Uint32).Load
inlining/once/main.go:6:6: moved to heap: once
inlining/once/main.go:7:10: func literal does not escape

打印日志中出现 inlining 关键字表示 main 中调用 sync.Once.Do 方法时确实存在内联优化。

作为对比,我们再来实现一个没有将 slow-path 分离出来的 Once 版本:

package sync

import (
 "sync"
 "sync/atomic"
)

type Once struct {
 done atomic.Uint32
 m    sync.Mutex
}

func (o *Once) Do(f func()) {
 if o.done.Load() == 0 {
  o.m.Lock()
  defer o.m.Unlock()
  if o.done.Load() == 0 {
   defer o.done.Store(1)
   f()
  }
 }
}

使用示例如下:

package once

import "github.com/jianghushinian/blog-go-example/sync/once/inlining/myonce/sync"

func main() {
 var once sync.Once
 once.Do(func() {
  println("Only once")
 })
}

执行 go build 查看内联情况:

$ go build -gcflags='-m' inlining/myonce/main.go
# command-line-arguments
inlining/myonce/main.go:5:6: can inline main
inlining/myonce/main.go:7:10: can inline main.func1
inlining/myonce/main.go:6:6: moved to heap: once
inlining/myonce/main.go:7:10: func literal does not escape

这一次编译器确实没有进行内联优化,可见 doSlow 函数的封装还是起了作用的。

sync.Once 就这么多功能,不过在 Go 1.21 中 Go 官方又增加了三个 sync.Once 相关函数: OnceFunc OnceValue OnceValues ,来增强 sync.Once 功能,接下来我们就依次介绍下。

sync.OnceFunc

源码解读

首先我们来看一下 sync.OnceFunc 源码实现:

https://github.com/golang/go/blob/go1.23.0/src/sync/oncefunc.go#L11

// OnceFunc returns a function that invokes f only once. The returned function
// may be called concurrently.
//
// If f panics, the returned function will panic with the same value on every call.
func OnceFunc(f func()func() {
 var (
  once  Once
  valid bool
  p     any
 )
 // Construct the inner closure just once to reduce costs on the fast path.
 g := func() {
  defer func() {
   p = recover()
   if !valid {
    // Re-panic immediately so on the first call the user gets a
    // complete stack trace into f.
    panic(p)
   }
  }()
  f()
  f = nil      // Do not keep f alive after invoking it.
  valid = true // Set only if f does not panic.
 }
 return func() {
  once.Do(g)
  if !valid {
   panic(p)
  }
 }
}

根据 OnceFunc 上方的代码注释可知:

  • OnceFunc 返回一个仅调用 f 一次的函数。这个返回的函数可以并发调用。
  • 如果函数 f 执行时出现 panic ,则返回的函数将在每次调用时会产生同样的 panic 值。

可以发现,其实 OnceFunc 函数就是对 once.Do 的封装,不过显然它考虑了更多情况,使用 defer + recover panic 进行捕获。用变量 p 暂存了 panic 信息,并且当多次调用 OnceFunc 返回函数时,都会重新 panic

NOTE:

如果你不熟悉 defer panic recover ,我在 《Go 错误处理指北:Defer、Panic、Recover 三剑客》 一文中对这三者进行了详细讲解,供你参考。

使用示例

sync.OnceFunc 使用示例如下:

package main

import (
 "fmt"
 "sync"
)

func main() {
 onceBody := sync.OnceFunc(func() {
  fmt.Println("Only once")
 })
 done := make(chan bool)
 for i := 0; i < 10; i++ {
  go func() {
   onceBody()
   done <- true
  }()
 }
 for i := 0; i < 10; i++ {
  <-done
 }
}

执行示例代码,得到如下输出:

$ go run oncefunc/main.go                       
Only once

如果发生 panic 会怎样呢,我们可以尝试一下:

package main

import (
 "fmt"
 "sync"
)

func main() {
 onceBody := sync.OnceFunc(func() {
  panic("Only once")
 })

 for i := 0; i < 5; i++ {
  func() {
   defer func() {
    r := recover()
    fmt.Println("recover", r)
   }()
   onceBody()
  }()
 }
}

执行示例代码,得到如下输出:

$ go run oncefunc/panic/main.go
recover Only once
recover Only once
recover Only once
recover Only once
recover Only once

作为对比,如果 sync.Once.Do 遇到 panic 又会怎样呢?示例如下:

package main

import (
 "fmt"
 "sync"
)

func main() {
 var once sync.Once
 onceBody := func() {
  panic("Only once")
 }

 for i := 0; i < 5; i++ {
  func() {
   defer func() {
    r := recover()
    fmt.Println("recover", r)
   }()
   once.Do(onceBody)
  }()
 }
}

执行示例代码,得到如下输出:

$ go run once/panic/main.go
recover Only once
recover 
recover 
recover 
recover 

由此可见,可以认为 sync.OnceFunc 是比 sync.Once.Do 更好用的接口,它帮我们考虑了函数 f 发生 panic 情况,所以可以考虑优先使用这个实现。

sync.OnceValue

源码解读

我们再来看下 sync.OnceValue 源码实现:

https://github.com/golang/go/blob/go1.23.0/src/sync/oncefunc.go#L43

// OnceValue returns a function that invokes f only once and returns the value
// returned by f. The returned function may be called concurrently.
//
// If f panics, the returned function will panic with the same value on every call.
func OnceValue[T any](f func() Tfunc() T {
 var (
  once   Once
  valid  bool
  p      any
  result T
 )
 g := func() {
  defer func() {
   p = recover()
   if !valid {
    panic(p)
   }
  }()
  result = f()
  f = nil
  valid = true
 }
 return func() T {
  once.Do(g)
  if !valid {
   panic(p)
  }
  return result
 }
}

可以看到,与 OnceFunc 不同的是 OnceValue 使用了泛型, OnceValue 接收的函数 f 是带有返回值的,并且它返回的函数也带有返回值。

也就是说,相较于 OnceFunc OnceValue 相当于是进化版,它接收的 f 函数签名不同,可以支持返回一个值,而其他的地方与 OnceFunc 实现并无区别,内部也只是多了一个使用 result T 记录返回值的逻辑。

使用示例

sync.OnceValue 使用示例如下:

package main

import (
 "fmt"
 "sync"
)

func main() {
 once := sync.OnceValue(func() int {
  sum := 0
  for i := 0; i < 1000; i++ {
   sum += i
  }
  fmt.Println("Computed once:", sum)
  return sum
 })
 done := make(chan bool)
 for i := 0; i < 10; i++ {
  go func() {
   const want = 499500
   got := once()
   if got != want {
    fmt.Println("want", want, "got", got)
   }
   done <- true
  }()
 }
 for i := 0; i < 10; i++ {
  <-done
 }
}

执行示例代码,得到如下输出:

$ go run oncevalue/main.go 
Computed once: 499500






请到「今天看啥」查看全文