我终于识破了这个 Go 编译器把戏

在 Go 语言的日常编码工作中,有一个非常普遍但诡异的编译错误,曾让我十分困惑。这个问题我相信不少 Gopher 都遇到过,不妨来看一下。

背景回顾

我们定义一个带有 WriteGoCode() 方法的 Gopher 接口,同时定义了 person 结构体,它存在 WriteGoCode() 方法。

type Gopher interface {
 WriteGoCode()
}

type person struct {
 name string
}

func (p person) WriteGoCode() {
 fmt.Printf("I am %s, i am writing go code!\n", p.name)
}

在 Go 语言中,只要某对象拥有接口的所有方法,那该对象即实现了该接口。pperson 结构体的实例化对象, Coding() 函数的入参是 Gopher 接口, person 对象实现了 Gopher 接口,因此 p 入参成功被运行。

func Coding(g Gopher) {
 g.WriteGoCode()
}

func main() {
 p := person{name: "小菜刀"}
 Coding(p)
}

// output:
I am 小菜刀, i am writing go code!

此时,我们将 Coding() 函数的入参改为 []Gopher 类型,入参为 []person

func Coding(gs []Gopher) {
 for _, g := range gs {
  g.WriteGoCode()
 }
}

func main() {
 p := []person{
  {name: "小菜刀1号"},
  {name: "小菜刀2号"},
 }
 Coding(p)
}

但是,这个时候,编译却不能通过!

./main.go:29:8: cannot use p (type []person) as type []Gopher in argument to Coding

明明 person 类型实现了 Gopher 接口,且当函数入参为 Gopher 类型时,能够顺利被执行,但参数变为 []Gopher 时,却过不了编译,这是为什么?

语法通用规则

这个问题在 stackoverflow 上被热议,详情见文末参考链接1。

在 Go 中,有一个通用规则,即语法不应隐藏复杂/昂贵的操作。转换一个 stringinterface{} 它的时间复杂度是 O(1),转换 []stringinterface{} 同样也是一个 O(1) 操作,因为它还是一个单一值的转换。

如果要将 []string 转换为 []interface{},它是 O(N) 操作。因为切片的每个元素都必须转换为 interface{},这违背了 Go 的语法原则。

这个回答,你们同意吗?

当然,此规则存在一个例外:转换字符串。在将 string 转换为 []byte[]rune 时,即使需要 O(n) 操作,但 Go 会允许执行。

InterfaceSlice 问题

Ian Lance Taylor(Go 核心开发者) 在 Go 官方仓库中也回答了这个问题,详情见文末参考链接2。他给出了这样做的两个主要原因。

  • 原因一:类型为 []interface{} 的变量不是 interface!它仅仅是一个元素类型恰好为 interface{} 的切片。
  • 原因二:[]interface{} 变量有特定大小的内存布局,在编译期可知。这与 []MyType 是不同的。

每个 interface{} (运行时通过 runtime.eface 表示)占两个字长(一个字代表所包含内容的类型 _type,另外一个字表示所包含的数据 data 或者指向它的指针 )

因此,类型为 []interface{} 的长度为N的变量,它是由N*2个字长的数据块支持。而这与类型为[]MyType 的长度为N 的变量的数据块大小是不同的,因为后者的数据块是N*sizeof(MyType) 字长。

数据块的不同,造成的结果是编译器无法快速地将 []MyType 类型的内容分配给 []interface{}类型的内容。

同理,[]Gopher 变量也是特定大小的内存布局(运行时通过 runtime.iface 表示)。这同样不能快速地将 []MyType 类型的内容分配给 []Gopher 类型。

因此,Ian Lance Taylor 回答闭环了 Go 的语法通用规则:Go 语法不应隐藏复杂/昂贵的操作,编译器会拒绝它们。

代码解决方案

再次将文章开头的例子附上,如果我们需要 [] person 类型的p能够成功入参 Coding()函数,应该如何做呢。

func Coding(gs []Gopher) {
 for _, g := range gs {
  g.WriteGoCode()
 }
}

func main() {
 p := []person{
  {name: "小菜刀1号"},
  {name: "小菜刀2号"},
 }
 Coding(p)
}

代码方案如下,核心是需要一个 []Gopher类型的转换变量。

func main() {
 p := []person{
  {name: "小菜刀1号"},
  {name: "小菜刀2号"},
 }
 var interfaceSlice []Gopher = make([]Gopher, len(p))
 for i, g := range p {
  interfaceSlice[i] = g
 }
 Coding(interfaceSlice)
}

// output:
I am 小菜刀1号, i am writing go code!
I am 小菜刀2号, i am writing go code!

总结

由于 []MyType[]interface{} 的转换,是昂贵的操作,Go 编译器不会允许这种情况通过编译,故而将这种开销的责任传递给开发者。

Go 是一门编译速度很快的语言,得益于它语法设计中贯彻着 “simpler is better”的理念,这可不是说说而已。

参考链接

【1. Type converting slices of interfaces】 https://stackoverflow.com/questions/12753805/type-converting-slices-of-interfaces/12754757#12754757

【2. InterfaceSlice】 https://github.com/golang/go/wiki/InterfaceSlice

全部评论(0)