10 | 简约不简单的匿名函数
下载APP
关闭
渠道合作
推荐作者
10 | 简约不简单的匿名函数
2019-05-31 景霄 来自北京
《Python核心技术与实战》
课程介绍
讲述:冯永吉
时长09:57大小9.09M
你好,我是景霄。
上一节,我们一起学习了 Python 中的“常规”函数,用途十分广泛。不过,除了常规函数,你应该也会在代码中见到一些“非常规”函数,它们往往很简短,就一行,并且有个很酷炫的名字——lambda,没错,这就是匿名函数。
匿名函数在实际工作中同样举足轻重,正确地运用匿名函数,能让我们的代码更简洁、易读。这节课,我们继续 Python 的函数之旅,一起来学习这个简约而不简单的匿名函数。
匿名函数基础
首先,什么是匿名函数呢?以下是匿名函数的格式:
我们可以看到,匿名函数的关键字是 lambda,之后是一系列的参数,然后用冒号隔开,最后则是由这些参数组成的表达式。我们通过几个例子看一下它的用法:
这里的匿名函数只输入一个参数 x,输出则是输入 x 的平方。因此当输入是 3 时,输出便是 9。如果把这个匿名函数写成常规函数的形式,则是下面这样:
可以看到,匿名函数 lambda 和常规函数一样,返回的都是一个函数对象(function object),它们的用法也极其相似,不过还是有下面几点区别。
第一,lambda 是一个表达式(expression),并不是一个语句(statement)。
所谓的表达式,就是用一系列“公式”去表达一个东西,比如x + 2、 x**2等等;
而所谓的语句,则一定是完成了某些功能,比如赋值语句x = 1完成了赋值,print 语句print(x)完成了打印,条件语句 if x < 0:完成了选择功能等等。
因此,lambda 可以用在一些常规函数 def 不能用的地方,比如,lambda 可以用在列表内部,而常规函数却不能:
再比如,lambda 可以被用作某些函数的参数,而常规函数 def 也不能:
常规函数 def 必须通过其函数名被调用,因此必须首先被定义。但是作为一个表达式的 lambda,返回的函数对象就不需要名字了。
第二,lambda 的主体是只有一行的简单表达式,并不能扩展成一个多行的代码块。
这其实是出于设计的考虑。Python 之所以发明 lambda,就是为了让它和常规函数各司其职:lambda 专注于简单的任务,而常规函数则负责更复杂的多行逻辑。关于这点,Python 之父 Guido van Rossum 曾发了一篇文章解释,你有兴趣的话可以自己阅读。
为什么要使用匿名函数?
理论上来说,Python 中有匿名函数的地方,都可以被替换成等价的其他表达形式。一个 Python 程序是可以不用任何匿名函数的。不过,在一些情况下,使用匿名函数 lambda,可以帮助我们大大简化代码的复杂度,提高代码的可读性。
通常,我们用函数的目的无非是这么几点:
减少代码的重复性;
模块化代码。
对于第一点,如果你的程序在不同地方包含了相同的代码,那么我们就会把这部分相同的代码写成一个函数,并为它取一个名字,方便在相对应的不同地方调用。
对于第二点,如果你的一块儿代码是为了实现一个功能,但内容非常多,写在一起降低了代码的可读性,那么通常我们也会把这部分代码单独写成一个函数,然后加以调用。
不过,再试想一下这样的情况。你需要一个函数,但它非常简短,只需要一行就能完成;同时它在程序中只被调用一次而已。那么请问,你还需要像常规函数一样,给它一个定义和名字吗?
答案当然是否定的。这种情况下,函数就可以是匿名的,你只需要在适当的地方定义并使用,就能让匿名函数发挥作用了。
举个例子,如果你想对一个列表中的所有元素做平方操作,而这个操作在你的程序中只需要进行一次,用 lambda 函数可以表示成下面这样:
如果用常规函数,则表示为这几行代码:
这里我简单解释一下。函数 map(function, iterable) 的第一个参数是函数对象,第二个参数是一个可以遍历的集合,它表示对 iterable 的每一个元素,都运用 function 这个函数。两者一对比,我们很明显地发现,lambda 函数让代码更加简洁明了。
再举一个例子,在 Python 的 Tkinter GUI 应用中,我们想实现这样一个简单的功能:创建显示一个按钮,每当用户点击时,就打印出一段文字。如果使用 lambda 函数可以表示成下面这样:
而如果我们用常规函数 def,那么需要写更多的代码:
显然,运用匿名函数的代码简洁很多,也更加符合 Python 的编程习惯。
Python 函数式编程
最后,我们一起来看一下,Python 的函数式编程特性,这与我们今天所讲的匿名函数 lambda,有着密切的联系。
所谓函数式编程,是指代码中每一块都是不可变的(immutable),都由纯函数(pure function)的形式组成。这里的纯函数,是指函数本身相互独立、互不影响,对于相同的输入,总会有相同的输出,没有任何副作用。
举个很简单的例子,比如对于一个列表,我想让列表中的元素值都变为原来的两倍,我们可以写成下面的形式:
这段代码就不是一个纯函数的形式,因为列表中元素的值被改变了,如果我多次调用 multiply_2() 这个函数,那么每次得到的结果都不一样。要想让它成为一个纯函数的形式,就得写成下面这种形式,重新创建一个新的列表并返回。
函数式编程的优点,主要在于其纯函数和不可变的特性使程序更加健壮,易于调试(debug)和测试;缺点主要在于限制多,难写。当然,Python 不同于一些语言(比如 Scala),它并不是一门函数式编程语言,不过,Python 也提供了一些函数式编程的特性,值得我们了解和学习。
Python 主要提供了这么几个函数:map()、filter() 和 reduce(),通常结合匿名函数 lambda 一起使用。这些都是你需要掌握的东西,接下来我逐一介绍。
首先是 map(function, iterable) 函数,前面的例子提到过,它表示,对 iterable 中的每个元素,都运用 function 这个函数,最后返回一个新的可遍历的集合。比如刚才列表的例子,要对列表中的每个元素乘以 2,那么用 map 就可以表示为下面这样:
我们可以以 map() 函数为例,看一下 Python 提供的函数式编程接口的性能。还是同样的列表例子,它还可以用 for 循环和 list comprehension(目前没有统一中文叫法,你也可以直译为列表理解等)实现,我们来比较一下它们的速度:
你可以看到,map() 是最快的。因为 map() 函数直接由 C 语言写的,运行时不需要通过 Python 解释器间接调用,并且内部做了诸多优化,所以运行速度最快。
接下来来看 filter(function, iterable) 函数,它和 map 函数类似,function 同样表示一个函数对象。filter() 函数表示对 iterable 中的每个元素,都使用 function 判断,并返回 True 或者 False,最后将返回 True 的元素组成一个新的可遍历的集合。
举个例子,比如我要返回一个列表中的所有偶数,可以写成下面这样:
最后我们来看 reduce(function, iterable) 函数,它通常用来对一个集合做一些累积操作。
function 同样是一个函数对象,规定它有两个参数,表示对 iterable 中的每个元素以及上一次调用后的结果,运用 function 进行计算,所以最后返回的是一个单独的数值。
举个例子,我想要计算某个列表元素的乘积,就可以用 reduce() 函数来表示:
当然,类似的,filter() 和 reduce() 的功能,也可以用 for 循环或者 list comprehension 来实现。
通常来说,在我们想对集合中的元素进行一些操作时,如果操作非常简单,比如相加、累积这种,那么我们优先考虑 map()、filter()、reduce() 这类或者 list comprehension 的形式。至于这两种方式的选择:
在数据量非常多的情况下,比如机器学习的应用,那我们一般更倾向于函数式编程的表示,因为效率更高;
在数据量不多的情况下,并且你想要程序更加 Pythonic 的话,那么 list comprehension 也不失为一个好选择。
不过,如果你要对集合中的元素,做一些比较复杂的操作,那么,考虑到代码的可读性,我们通常会使用 for 循环,这样更加清晰明了。
总结
这节课,我们一起学习了 Python 中的匿名函数 lambda,它的主要用途是减少代码的复杂度。需要注意的是 lambda 是一个表达式,并不是一个语句;它只能写成一行的表达形式,语法上并不支持多行。匿名函数通常的使用场景是:程序中需要使用一个函数完成一个简单的功能,并且该函数只调用一次。
其次,我们也入门了 Python 的函数式编程,主要了解了常见的 map(),fiilter() 和 reduce() 三个函数,并比较了它们与其他形式(for 循环,comprehension)的性能,显然,它们的性能效率是最优的。
思考题
最后,我想给你留下两道思考题。
第一问:如果让你对一个字典,根据值进行由高到底的排序,该怎么做呢?以下面这段代码为例,你可以思考一下。
第二问:在实际工作学习中,你遇到过哪些使用匿名函数的场景呢?
欢迎在留言区写下你的答案想法,与我讨论,也欢迎你把这篇文章分享给你的同事、朋友。
分享给需要的人,Ta购买本课程,你将得18元
生成海报并分享
赞 39
提建议
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
上一篇
09 | 不可或缺的自定义函数
下一篇
11 | 面向对象(上):从生活中的类比说起
精选留言(124)
- Hoo-Ah2019-05-31第一问:sorted(d.items(), key=lambda x: x[1], reverse=True); 第二问:最开始接触 lambda 匿名函数的时候觉得蛮不理解的,觉得这个函数没有灵魂,用完一次就扔掉。后来在和高阶函数、列表生成式搭配使用以及一些小功能的使用上觉得很好用,这样代码即简洁又易于阅读。 注:匿名函数最难理解的地方就是要传入的参数是一个可迭代的对象,lambda 内部会调用可迭代对象的 __next__ 方法取值当作参数传入 lambda 函数冒号前面的值,然后把表达式计算的结果进行返回。展开
作者回复: 你说的对。关于迭代器生成器后面会讲到,所以这篇文章没有提及。
共 9 条评论79 - Mr_scx2020-02-16关于map()、filter() 和 reduce()三个函数,需要注意的是: 1.map()在 Python 2.x 返回的是一个列表;而在 Python 3.x 中返回一个 map 类,可以看成是一个迭代器。 2.filter()在 Python 2.x 中返回的是过滤后的列表, 而在 Python 3.x 中返回的是一个 filter 类,可以看成是一个迭代器,有惰性运算的特性, 相对 Python2.x 提升了性能, 可以节约内存。 3.reduce() 函数在 Python3 中已经被从全局名字空间里移除了,它现在被放置在 functools 模块里,如果想要使用它,则需要通过引入 functools 模块来调用 reduce() 函数。展开52
- lmingzhi2019-05-31python3 -mtimeit -s'xs=range(1000000)' 'map(lambda x: x*2, xs)' 这个地方map生成的是生成器,与后面的2个做比较感觉不大合适,是否更改为测试list(map(lambda x: x*2, xs))更恰当?
作者回复: 实际情况中,Map返回的对象依然可以直接遍历,所以直接比较从实用的角度上来说也是可以的,Map在Python3中变为Lazy了以后,速度得到了很大的提升。当然,如果以返回的类型一致为标准,你的建议也是可以的
共 3 条评论35 - Jove2019-05-31在python3中,map、filter函数返回的是迭代器,不是集合共 1 条评论33
- 爬行的蜗牛2019-06-041.reduce报错问题,python3需要加 from functools import reduce 2.filter,print变量时,需要加list() 如下: l =[1,2,3,4,5] new_list3 = filter(lambda x:x%2==0,l) list(new_list3) # 输出 [2,4]展开27
- 欧2019-06-15每次听音频的时候,老师说到建议听音频的同学打开文章,获得最优学习体验时,我就想把这段话装入函数里,哈哈哈共 2 条评论20
- hello,everyone2019-07-26数据清洗过程常用lambda 函数 data["工作日"] = data["日期"].map(lambda x: x.weekday()) data["工作日"] = data["工作日"].map(lambda x: 1 if x<5 else 0)15
- 轻风悠扬2019-11-02sorted(d.items(), key = lambda x: x[1], reverse = True) 返回的是list of tuple, 我觉得答案应该是dict(sorted(d.items(), key = lambda x: x[1], reverse = True))11
- Geek_59f23e2019-05-311. sorted(d.item(), key = lambda x: x[1], reverse = True) 2. 一般想偷懒和装X的时候用(来个玩笑😜)10
- Steven2019-06-02我还以为列表推导式已经是公认的说法了,原来还没有统一呀😄 。 不过之前也有看过流畅的python,好像说也是列表推导式比map更快。共 2 条评论7
- 向南2020-03-07```python sorted(d.items(), key=lambda x: x[1], reverse=True) ``` lambda函数在数据清洗的时候,作用很大
作者回复: 必须的
6 - Geek_59f23e2019-05-31一楼说的对,list(map(###))和列表推导式对比更科学,显然后者生成列表速度更快,另外我实测圆括号生成器和map生成器速度在一个数量级,性能差别很小,结果如下: 函数generator被调用了1000000次,共计用时:2.248 秒 <generator object generator.<locals>.<genexpr> at 0x000002D735AE5ED0> 函数map被调用了1000000次,共计用时:2.243 秒 <map object at 0x000002D7346F7470>展开6
- 轻风悠扬2019-11-02老师,python3 里面调用reduce 方法需要引入functools4
- catshitfive2019-05-31应用场景举个栗子:比如在 pandas 中对二维数据进行数据分析时,对于某些数据块我们需要用函数如apply applymap transform 等进行临时性一次性的转换变更以得到最终的分析结果,那么就可以用匿名函数配合着来使用,使代码更简洁易读高效4
- 懒猫2021-05-29{k:v for k, v in sorted(d.items(), key=lambda x: x[1], reverse=True)}2
- 憨皮苏2021-04-03def square(x): return x**2 print([square(x) for x in range(10)]) 常规函数不也是可以用在列表内部的吗?展开2
- kilien2019-06-10不好意思问个低级问题, python -mtimeit -s'xs=range(1000000)' 'map(lambda x: x*2, xs)' 这句代码在windows的dos环境里跑的话,会报SyntaxError: EOL while scanning string literal, Python版本是3.6.3,-s后面好像只能接受一对单引号共 2 条评论2
- 天天有吃的2021-03-12reduce查看菜鸟教程的解释如下,有这个问题如果懂的人自然看得懂文中解释,不懂的人比如我女友文中的看不懂菜鸟的看了就明白,这里写的规则太抽象了,只是描述功能,具体的运行流程都没写出来;类似数学给了个定理就开始解题… 菜鸟解释:函数将一个数据集合(链表,元组等)中的所有数据进行下列操作:用传给 reduce 中的函数 function(有两个参数)先对集合中的第 1、2 个元素进行操作,得到的结果再与第三个数据用 function 函数运算,最后得到一个结果。展开1
- Bee2020-07-30第一题:d2 = sorted(d.items(), key=lambda x: x[1], reverse=True) 第二题:基本就是使用函数式编程用的比较多1
- Kevin2020-06-18在我做前端项目时,回调函数,定时器的回调函数时用匿名函数;如: setTimeout(() => {}, 1000) require(url, () => {})1