41 | 驯服泛型:明确使用时机
下载APP
关闭
渠道合作
推荐作者
41 | 驯服泛型:明确使用时机
2022-11-09 Tony Bai 来自北京
《Tony Bai · Go语言第一课》
课程介绍
讲述:Tony Bai
时长16:47大小15.33M
你好,我是 Tony Bai。
在前面关于 Go 泛型的两讲中,我们学习了 Go 泛型的基本语法类型参数,掌握了使用 Go 内置约束和自定义约束的方法,并对 Go 泛型新引入的类型集合概念做了全面说明。有了上面的知识铺垫后,我相信你已经具备了应用泛型语法编写泛型函数、定义泛型类型和方法的能力了。
不过,Go 对泛型的支持,在提升了 Go 语言表达力的同时,也带来了不小的复杂性。也就是说,使用了泛型语法编写的代码在可读性、可理解性以及可维护性方面,相比于非泛型代码都有一定程度的下降。Go 当初没有及时引入泛型的一个原因就是泛型与 Go 语言“简单”的设计哲学有悖,现在加入了泛型,Go 核心团队以及 Go 社区却又开始担心“泛型被滥用”。
不过作为 Go 语言开发人员,我们每个人都有义务去正确、适当的使用泛型,而不是滥用或利用泛型炫技,因此在泛型篇的这最后一讲中,我就来说说什么时机适合使用泛型,供你参考。
何时适合使用泛型?
Go 泛型语法体现在类型参数上,所以说,类型参数适合的场景就是适合应用泛型编程的时机。我们先来看看类型参数适合的第一种场景。
场景一:编写通用数据结构时
在 Go 尚不支持泛型的时候,如果要实现一个通用的数据结构,比如一个先入后出的 stack 数据结构,我们通常有两个方案。
第一种方案是为每种要使用的元素类型单独实现一套栈结构。如果我们要在栈里管理 int 型数据,我们就实现一个 IntStack;如果要管理 string 类型数据,我们就再实现一个 StringStack……总之,我们需要根据可能使用到的元素类型实现出多种专用的栈结构。
这种方案的优点是便于编译器的静态类型检查,保证类型安全,且运行性能很好,因为 Go 编译器可以对代码做出很好的优化。不过这种方案的缺点也很明显,那就是会有大量的重复代码。
第二种方案是使用 interface{}实现通用数据结构。
在泛型之前,Go 语言中唯一具有“通用”语义的语法就是 interface{}了。无论 Go 标准库还是第三方实现的通用数据结构都是基于 interface{}实现的,比如下面标准库中 ring 包中 Ring 结构就是使用 interface{}作为元素类型的:
使用 interface{}固然可以实现通用数据结构,但 interface{}接口类型的固有特性也决定了这个方案也自带以下“先天不足”:
Go 编译器无法在编译阶段对进入数据结构中的元素的类型进行静态类型检查;
要想得到元素的真实类型,不可避免要进行类型断言或 type switch 操作;
不同类型数据赋值给 interface{}或从 interface{}还原时执行的装箱和拆箱操作带来的额外开销。
我们可以看到,以上两个方案都有各自的不足,那么有比较理想的方案么?
有的,那就是使用 Go 泛型。其实不止 Go 语言,其他支持泛型的主流编程语言的通用数据结构实现也都使用了泛型。下面是用 Go 泛型实现一个 stack 数据结构的示例代码:
泛型版实现基本消除了前面两种方案的不足,如果非要说和 IntStack、StringStack 等的差异,那可能就是在执行性能上要差一些了:
当然,泛型版本性能略差与泛型的实现原理有关,这个我们后面再细说。
场景二:函数操作的是 Go 原生的容器类型时
如果函数具有切片、map 或 channel 这些 Go 内置容器类型的参数,并且函数代码未对容器中的元素类型做任何特定假设,那我们使用类型参数可能很有帮助。
39 讲中的 maxGenerics 那个例子就是这个情况,我们再回顾一下:
我们看到,类型参数使得此类容器算法与容器内元素类型彻底解耦。在没有泛型语法之前,实现这样的函数通常需要使用反射。不过使用反射,会让代码可读性大幅下降,编译器也无法做静态类型检查,并且运行时开销也大得很。
场景三:不同类型实现一些方法的逻辑相同时
在 Go 编码过程中,我们经常会遇到这样一种情况,某个函数接受一个自定义接口类型作为参数,就像下面的 doSomething 函数以及其参数类型 MyInterface 接口:
只有实现了 MyInterface 中全部三个方法的类型,才被允许作为实参传递给 doSomething 函数。当这些类型实现 M1、M2 和 M3 的逻辑看起来都相同时,我们就可以使用类型参数来帮助实现 M1~M3 这些方法了,下面就是通过类型参数实现这些方法的通用逻辑代码(实际逻辑做了省略处理):
我们看到,使用不同类型,比如 int、string 等作为 commonMethod 的类型实参就可以得到相应实现了 M1~M3 的类型的变量,比如 intThings、stringThings,这些变量可以直接作为实参传递给 doSomething 函数。
当然我们也可以再封装一个泛型函数来简化上述调用:
这里的 doSomethingCM 泛型函数将 commonMethod 泛型类型实例化与调用 doSomething 函数的过程封装到一起,使得 commonMethod 泛型类型的使用进一步简化了。
其实,Go 标准库的 sort.Sort 就是这样的情况,其参数类型为 sort.Interface,而 sort.Interface 接口中定义了三个方法:
所有实现 sort.Interface 类型接口的类型,在实现 Len、Less 和 Swap 这三个通用方法的逻辑看起来都相同,比如 sort.go 中提供的 StringSlice 和 IntSlice 两种类型的三个方法的实现如下:
在这样的情况下,我们就可以通过类型参数来给出这三个方法的通用实现,这里我将其作为本讲的思考题留给你自己去实现。
不过要注意:如果多个类型实现上述方法的逻辑并不相同,那么我们就不应该使用类型参数。
好了,到这里最适合使用泛型的时机我都已经介绍了一遍。如果非要总结为一条,那就是:如果你发现自己多次编写完全相同的代码,其中副本之间的唯一区别是代码使用不同的类型,那么可考虑使用类型参数了。
假使你目前遇到的场景适合使用泛型,你可能依然会犹豫要不要使用泛型,因为你还不清楚泛型对代码执行性能的影响。特别是在一些性能敏感的系统中,这一点尤为重要。那么如何知道泛型对执行性能的影响呢?这就要从 Go 泛型实现原理说起了。
Go 泛型实现原理简介
我在泛型加餐一文中曾提过:Go 核心团队对泛型实现的探索开始得很早,在 2009 年 12 月,Go 团队技术领导者 Russ Cox 就在其博客站点上发表一篇名为“泛型窘境”的文章。在这篇文章中,Russ Cox 提出了 Go 面对泛型可遵循的三个路径以及每个路径的不足,也就是三个 slow(拖慢):
C 语言路径:不实现泛型,不会引入复杂性,但这会“拖慢程序员”,因为可能需要程序员花费精力做很多重复实现;
C++ 语言路径:就像 C++ 的泛型实现方案那样,通过增加编译器负担为每个类型实参生成一份单独的泛型函数的实现,这种方案产生了大量的代码,其中大部分是多余的,有时候还需要一个好的链接器来消除重复的拷贝,显然这个实现路径会“拖慢编译器”;
Java 路径:就像 Java 的泛型实现方案那样,通过隐式的装箱和拆箱操作消除类型差异,虽然节省了空间,但代码执行效率低,即“拖慢执行性能”。
如今 Go 加入了泛型,显然 C 语言的“拖慢程序员”这个路径被否决了,那么在剩下两个路径中,Go 选择了哪条呢?下面我们就来真正看一下 Go 泛型的实现方案。
为了让你更好地理解泛型实现原理,我先来逐一对上述方案做个简单介绍。我们首先看一下 Stenciling 方案。
Stenciling 方案
Stenciling 方案也称为模板方案(如上图), 它也是 C++、Rust 等语言使用的实现方案。其主要思路就是在编译阶段,根据泛型函数调用时类型实参或约束中的类型元素,为每个实参类型或类型元素中的类型生成一份单独实现。这么说还是很抽象,下图很形象地说明了这一过程:
我们看到,Go 编译器为每个调用生成一个单独的函数副本(图中函数名称并非真实的,仅为便于说明而做的命名),相同类型实参的函数只生成一次,或通过链接器消除不同包的相同函数实现。
图示的这一过程在其他编程语言中也被称为“单态化(monomorphization)”。单态是相对于泛型函数的参数化多态(parametric polymorphism)而言的。
Randall 博士也提到了这种方案的不足,那就是拖慢编译器。泛型函数需要针对不同类型进行单独编译并生成一份独立的代码。如果类型非常多,那么编译出来的最终文件可能会非常大。同时由于 CPU 缓存无法命中、指令分支预测等问题,可能导致生成的代码运行效率不高。
当然,对于性能不高这个说辞,我个人持保留态度,因为模板方案在其他编程语言中基本上是没有额外的运行时开销的,并且是应该是对编译器优化友好的。很多面向系统编程的语言都选择该方案,比如 C++、D 语言、Rust 等。
Dictionaries 方案
Dictionaries 方案与 Stenciling 方案的实现思路正相反,它不会为每个类型实参单独创建一套代码,反之它仅会有一套函数逻辑,但这个函数会多出一个参数 dict,这个参数会作为该函数的第一个参数,这和 Go 方法的 receiver 参数在方法调用时自动作为第一个参数有些类似。这个 dict 参数中保存泛型函数调用时的类型实参的类型相关信息。下面是 Dictionaries 方案的示意图:
包含类型信息的字典是 Go 编译器在编译期间生成的,并且被保存在 ELF 的只读数据区段(.data)中,传给函数的 dict 参数中包含了到特定字典的指针。从方案描述来看,每个 dict 中的类型信息还是十分复杂的,不过我们了解这些就够了,对 dict 的结构就不展开说明了。
这种方案也有自身的问题,比如字典递归的问题,如果调用某个泛型函数的类型实参有很多,那么 dict 信息也会过多等等。更重要的是它对性能可能有比较大的影响,比如通过 dict 的指针的间接类型信息和方法的访问导致运行时开销较大;再比如,如果泛型函数调用时的类型实参是 int,那么如果使用 Stenciling 方案,我们可以通过寄存器复制即可实现 x=y 的操作,但在 Dictionaries 方案中,必须通过 memmove 了。
Go 最终采用的方案:GC Shape Stenciling 方案
GC Shape Stenciling 方案顾名思义,它基于 Stenciling 方案,但又没有为所有类型实参生成单独的函数代码,而是以一个类型的 GC shape 为单元进行函数代码生成。一个类型的 GC shape 是指该类型在 Go 内存分配器 / 垃圾收集器中的表示,这个表示由类型的大小、所需的对齐方式以及类型中包含指针的部分所决定。
这样一来势必就有 GC shape 相同的类型共享一个实例化后的函数代码,那么泛型调用时又是如何区分这些类型的呢?
答案就是字典。该方案同样在每个实例化后的函数代码中自动增加了一个 dict 参数,用于区别 GC shape 相同的不同类型。可见,GC Shape Stenciling 方案本质上是 Stenciling 方案和 Dictionaries 方案的混合版,它也是 Go 1.18 泛型最终采用的实现方案,为此 Go 团队还给出一个更细化、更接近于实现的 GC Shape Stenciling 实现方案。
下面是 GC Shape Stenciling 方案的示意图:
那么如今的 Go 版本(Go 1.19.x)究竟会为哪些类型实例化出一份独立的函数代码呢?我们通过下面示例来看一下:
在这个示例中,我们声明了一个简单的泛型函数 f,然后分别用不同的 Go 原生类型、自定义类型以及指针类型作为类型实参对 f 进行调用,我们通过工具为上述 goshape.go 生成的汇编代码如下:
从上图我们看到,Go 编译器为每个底层类型相同的类型生成一份函数代码,像 MyInt 和 int、rune 和 int32;对于所有指针类型,像上面的 *float64、int 和int32,仅生成一份名为 main.f[go.shape.*uint8_0]的函数代码。
这与新版 GC shape 方案中的描述是一致的:“我们目前正在以一种相当精细的方式实现 gc shapes。当且仅当两个具体类型具有相同的底层类型或者它们都是指针类型时,它们才会在同一个 gcshape 分组中”。
泛型对执行效率的影响
通过上面对 Go 泛型实现原理的了解,我们看到目前的 Go 泛型实现选择了一条折中的路线:既没有选择纯 Stenciling 方案,避免了对 Go 编译性能带去较大影响,也没有选择像 Java 那样泛型那样的纯装箱和拆箱方案,给运行时带去较大开销。
但 GC Shape+Dictionaries 的混合方案也确实会给泛型在运行时的执行效率带去影响,我们来看一个简单的实例:
这个示例用于对比泛型函数实例化后的函数代码(如 add[int])的性能与单态下的函数(如 addInt)性能,下面是 benchmark 代码:
运行这个 benchmark:
不过好消息是:在 Go 1.20 版本中,由于将使用 Unified IR(中间代码表示)替换现有的 IR 表示,Go 泛型函数的执行性能将得到进一步优化,上述的 benchmark 中两个函数的执行性能将不分伯仲,Go 1.19 中也可使用 GOEXPERIMENT=unified 来开启 Unified IR 试验性功能。
我们在 Unified IR 开启的情况下再跑一次上面的 benchmark:
这次的对比结果就非常理想了!
综上,我建议你在一些性能敏感的系统中,还是要慎用尚未得到足够性能优化的泛型;而在性能不那么敏感的情况下,在符合前面泛型使用时机的时候,我们还是可以大胆使用泛型语法的。
小结
好了,今天的课讲到这里就结束了,现在我们一起来回顾一下吧。
在这一讲中,我们探讨了有关 Go 泛型的一个重要的问题:何时使用泛型。泛型语法的加入,不可避免地提升了 Go 语法的复杂性,为了防止 Gopher 滥用泛型,我们给出了几个 Go 泛型最适合应用的场景,包括:编写通用数据结构、编写操作 Go 原生容器类型时以及不同类型实现一些方法的逻辑看起来相同时。除此之外的其他场景下,如果你要使用泛型,务必慎重并深思熟虑。
Go 泛型的编译性能和执行性能也是影响我们是否应用泛型的重要因素,Go 核心团队在 Go 泛型实现方案的选择上也是煞费苦心,最终选择了 GC shape stenciling 的混合方案,目前这个方案很大程度避免了对 Go 编译性能的影响,但对 Go 泛型代码的执行效率依然存在不小影响。相信经过几个版本打磨和优化后,Go 泛型的执行性能会有提升,甚至能接近于非泛型的单态版。
这里我还要提一下,Go 泛型的实现方案也可能在未来版本中发生变化,从目前看,本讲中的内容仅针对 Go 1.18 和 Go 1.19 的 GC Shape stenciling 方案适用。
思考题
请你为 Go 标准库 sort.Interface 接口类型提供一个像文中示例 common_method.go 中那样的通用方法的泛型实现。
至此,泛型篇三讲就彻底讲完了。如果你有什么问题,欢迎在评论区留言。
分享给需要的人,Ta购买本课程,你将得18元
生成海报并分享
赞 0
提建议
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
上一篇
40|驯服泛型:定义泛型约束
下一篇
加餐|我“私藏”的那些优质且权威的Go语言学习资料
精选留言(5)
- Geek142023-01-06 来自辽宁请教老师两个问题: 1、在讲解泛型实现原理时,文中提到“C++ 语言路径:就像 C++ 的泛型实现方案那样,通过增加编译器负担为每个类型实参生成一份单独的泛型函数的实现,这种方案产生了大量的代码,其中大部分是多余的,……” 为啥“其中大部分是多余的”,每个类型实参一个单独的实现,这不是刚刚好吗,为啥会有多余的实现? 2、Dictionaries 方案没看明白。模板方案比较好理解。编译阶段为每个类型实参创建一个泛型函数的单独实现,单独实现后函数内使用的泛型类型都会是具体的类型。那Dictionaries 方案种泛型函数中的泛型类型是具体类型实参类型吗?如果是具体的实参的类型,是怎么做到? 希望老师有时间帮忙解答下疑惑。展开
作者回复: 都是好问题。 问题1:这句话来自于Russ Cox 的“泛型窘境”的文章。不知道你对c++的编译过程了解怎样。像c/c++这样的源码的编译分为两个阶段:编译和链接。其中编译阶段是以.c/.cpp为编译单元,将源码编译为一个个.o文件,每个编译单元的编译都是独立的。因此如果一个泛型函数在多个编译单元都会被调用(比如实参是int),那么每个编译单元编译时都会为int生成一份独立的泛型函数代码,这样就拖慢了编译器的编译时间。之后在链接阶段,链接器才会将位于各个.o中的这些冗余的重复代码进行清除,只保留一份。 问题2:调用泛型函数时传入的实参肯定是实参类型啊。这块编译器会将其转换为特定的函数调用,比如:f(dict.float64, 3.14)。至于具体实现,https://github.com/golang/proposal/blob/master/design/generics-implementation-dictionaries.md 这个proposal design给出了一个伪码的例子,可以看看那个。
共 2 条评论1 - Calvin2022-11-10 来自北京思考题: // sort.Interface -> IntSlice / StringSlice 泛型版 type xsl interface { ~int | ~string } type xSlice[T xsl] []T func (x xSlice[T]) Len() int { return len(x) } func (x xSlice[T]) Less(i, j int) bool { return x[i] < x[j] } func (x xSlice[T]) Swap(i, j int) { x[i], x[j] = x[j], x[i] } func sortX[T xsl](data xSlice[T]) { sort.Sort(data) } func TestXSlice(t *testing.T) { x1 := make(xSlice[int], 0, 5) x1 = append(x1, 3) x1 = append(x1, 10) x1 = append(x1, 2) x1 = append(x1, 0) x1 = append(x1, 9) sortX(x1) t.Logf("[]~int x = %#v", x1) type mystr string x2 := []mystr{"ab", "ca", "fc", "ce", "bf"} sortX(x2) t.Logf("[]~string x = %#v", x2) }展开
作者回复: 👍。
1 - Geek142023-01-06 来自辽宁// 定义一个支持比较的接口,用于类型参数约束 type ordered interface { ~int | ~int8 | ~int16 | ~int32 | ~int64 | ~uint | ~uint8 | ~uint16 | ~uint32 | ~uint64 | ~uintptr | ~float32 | ~float64 | ~string } // 定义支持排序的泛型切片 type SortableSlice[T ordered] []T // 让泛型切片实现sort.Interface func (s SortableSlice[T]) Len() int { return len(s) } func (s SortableSlice[T]) Swap(i, j int) { s[i], s[j] = s[j], s[i] } func (s SortableSlice[T]) Less(i, j int) bool { return s[i] < s[j] } // 定义一个泛型排序函数 func SortGeneric[T ordered](s SortableSlice[T]) { sort.Sort(s) }展开
作者回复: 👍
- return2022-12-07 来自广东老师讲的好呀,感谢老师。 期待老师新作品。
作者回复: 👍
- 罗杰2022-11-09 来自北京看一遍肯定是不够的,🉐️好好吸收
作者回复: 👍