极客时间已完结课程限时免费阅读

08 | 异常处理:如何提高程序的稳定性?

08 | 异常处理:如何提高程序的稳定性?-极客时间

08 | 异常处理:如何提高程序的稳定性?

讲述:冯永吉

时长08:49大小8.06M

你好,我是景霄。
今天这节课,我想和你聊聊 Python 的异常处理。和其他语言一样,异常处理是 Python 中一种很常见,并且很重要的机制与代码规范。
我在实际工作中,见过很多次这样的情况:一位工程师提交了代码,不过代码某处忘记了异常处理。碰巧这种异常发生的频率不低,所以在代码 push 到线上后没多久,就会收到紧急通知——服务器崩溃了。
如果事情严重,对用户的影响也很大,这位工程师还得去专门的会议上做自我检讨,可以说是很惨了。这类事件层出不穷,也告诉我们,正确理解和处理程序中的异常尤为关键。

错误与异常

首先要了解,Python 中的错误和异常是什么?两者之间又有什么联系和区别呢?
通常来说,程序中的错误至少包括两种,一种是语法错误,另一种则是异常。
所谓语法错误,你应该很清楚,也就是你写的代码不符合编程规范,无法被识别与执行,比如下面这个例子:
if name is not None
print(name)
If 语句漏掉了冒号,不符合 Python 的语法规范,所以程序就会报错invalid syntax
而异常则是指程序的语法正确,也可以被执行,但在执行过程中遇到了错误,抛出了异常,比如下面的 3 个例子:
10 / 0
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
ZeroDivisionError: integer division or modulo by zero
order * 2
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
NameError: name 'order' is not defined
1 + [1, 2]
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: unsupported operand type(s) for +: 'int' and 'list'
它们语法完全正确,但显然,我们不能做除法时让分母为 0;也不能使用未定义的变量做运算;而让一个整型和一个列表相加也是不可取的。
于是,当程序运行到这些地方时,就抛出了异常,并且终止运行。例子中的ZeroDivisionError NameErrorTypeError,就是三种常见的异常类型。
当然,Python 中还有很多其他异常类型,比如KeyError是指字典中的键找不到;FileNotFoundError是指发送了读取文件的请求,但相应的文件不存在等等,我在此不一一赘述,你可以自行参考相应文档

如何处理异常

刚刚讲到,如果执行到程序中某处抛出了异常,程序就会被终止并退出。你可能会问,那有没有什么办法可以不终止程序,让其照样运行下去呢?答案当然是肯定的,这也就是我们所说的异常处理,通常使用 try 和 except 来解决,比如:
try:
s = input('please enter two numbers separated by comma: ')
num1 = int(s.split(',')[0].strip())
num2 = int(s.split(',')[1].strip())
...
except ValueError as err:
print('Value Error: {}'.format(err))
print('continue')
...
这里默认用户输入以逗号相隔的两个整形数字,将其提取后,做后续的操作(注意 input 函数会将输入转换为字符串类型)。如果我们输入a,b,程序便会抛出异常invalid literal for int() with base 10: 'a',然后跳出 try 这个 block。
由于程序抛出的异常类型是 ValueError,和 except block 所 catch 的异常类型相匹配,所以 except block 便会被执行,最终输出Value Error: invalid literal for int() with base 10: 'a',并打印出continue
please enter two numbers separated by comma: a,b
Value Error: invalid literal for int() with base 10: 'a'
continue
我们知道,except block 只接受与它相匹配的异常类型并执行,如果程序抛出的异常并不匹配,那么程序照样会终止并退出。
所以,还是刚刚这个例子,如果我们只输入1,程序抛出的异常就是IndexError: list index out of range,与 ValueError 不匹配,那么 except block 就不会被执行,程序便会终止并退出(continue 不会被打印)。
please enter two numbers separated by comma: 1
IndexError Traceback (most recent call last)
IndexError: list index out of range
不过,很显然,这样强调一种类型的写法有很大的局限性。那么,该怎么解决这个问题呢?
其中一种解决方案,是在 except block 中加入多种异常的类型,比如下面这样的写法:
try:
s = input('please enter two numbers separated by comma: ')
num1 = int(s.split(',')[0].strip())
num2 = int(s.split(',')[1].strip())
...
except (ValueError, IndexError) as err:
print('Error: {}'.format(err))
print('continue')
...
或者第二种写法:
try:
s = input('please enter two numbers separated by comma: ')
num1 = int(s.split(',')[0].strip())
num2 = int(s.split(',')[1].strip())
...
except ValueError as err:
print('Value Error: {}'.format(err))
except IndexError as err:
print('Index Error: {}'.format(err))
print('continue')
...
这样,每次程序执行时,except block 中只要有一个 exception 类型与实际匹配即可。
不过,很多时候,我们很难保证程序覆盖所有的异常类型,所以,更通常的做法,是在最后一个 except block,声明其处理的异常类型是 Exception。Exception 是其他所有非系统异常的基类,能够匹配任意非系统异常。那么这段代码就可以写成下面这样:
try:
s = input('please enter two numbers separated by comma: ')
num1 = int(s.split(',')[0].strip())
num2 = int(s.split(',')[1].strip())
...
except ValueError as err:
print('Value Error: {}'.format(err))
except IndexError as err:
print('Index Error: {}'.format(err))
except Exception as err:
print('Other error: {}'.format(err))
print('continue')
...
或者,你也可以在 except 后面省略异常类型,这表示与任意异常相匹配(包括系统异常等):
try:
s = input('please enter two numbers separated by comma: ')
num1 = int(s.split(',')[0].strip())
num2 = int(s.split(',')[1].strip())
...
except ValueError as err:
print('Value Error: {}'.format(err))
except IndexError as err:
print('Index Error: {}'.format(err))
except:
print('Other error')
print('continue')
...
需要注意,当程序中存在多个 except block 时,最多只有一个 except block 会被执行。换句话说,如果多个 except 声明的异常类型都与实际相匹配,那么只有最前面的 except block 会被执行,其他则被忽略。
异常处理中,还有一个很常见的用法是 finally,经常和 try、except 放在一起来用。无论发生什么情况,finally block 中的语句都会被执行,哪怕前面的 try 和 excep block 中使用了 return 语句。
一个常见的应用场景,便是文件的读取:
import sys
try:
f = open('file.txt', 'r')
.... # some data processing
except OSError as err:
print('OS error: {}'.format(err))
except:
print('Unexpected error:', sys.exc_info()[0])
finally:
f.close()
这段代码中,try block 尝试读取 file.txt 这个文件,并对其中的数据进行一系列的处理,到最后,无论是读取成功还是读取失败,程序都会执行 finally 中的语句——关闭这个文件流,确保文件的完整性。因此,在 finally 中,我们通常会放一些无论如何都要执行的语句。
值得一提的是,对于文件的读取,我们也常常使用 with open,你也许在前面的例子中已经看到过,with open 会在最后自动关闭文件,让语句更加简洁。

用户自定义异常

前面的例子里充斥了很多 Python 内置的异常类型,你可能会问,我可以创建自己的异常类型吗?
答案是肯定是,Python 当然允许我们这么做。下面这个例子,我们创建了自定义的异常类型 MyInputError,定义并实现了初始化函数和 str 函数(直接 print 时调用):
class MyInputError(Exception):
"""Exception raised when there're errors in input"""
def __init__(self, value): # 自定义异常类型的初始化
self.value = value
def __str__(self): # 自定义异常类型的string表达形式
return ("{} is invalid input".format(repr(self.value)))
try:
raise MyInputError(1) # 抛出MyInputError这个异常
except MyInputError as err:
print('error: {}'.format(err))
如果你执行上述代码块并输出,便会得到下面的结果:
error: 1 is invalid input
实际工作中,如果内置的异常类型无法满足我们的需求,或者为了让异常更加详细、可读,想增加一些异常类型的其他功能,我们可以自定义所需异常类型。不过,大多数情况下,Python 内置的异常类型就足够好了。

异常的使用场景与注意点

学完了前面的基础知识,接下来我们着重谈一下,异常的使用场景与注意点。
通常来说,在程序中,如果我们不确定某段代码能否成功执行,往往这个地方就需要使用异常处理。除了上述文件读取的例子,我可以再举一个例子来说明。
大型社交网站的后台,需要针对用户发送的请求返回相应记录。用户记录往往储存在 key-value 结构的数据库中,每次有请求过来后,我们拿到用户的 ID,并用 ID 查询数据库中此人的记录,就能返回相应的结果。
而数据库返回的原始数据,往往是 json string 的形式,这就需要我们首先对 json string 进行 decode(解码),你可能很容易想到下面的方法:
import json
raw_data = queryDB(uid) # 根据用户的id,返回相应的信息
data = json.loads(raw_data)
这样的代码是不是就足够了呢?
要知道,在 json.loads() 函数中,输入的字符串如果不符合其规范,那么便无法解码,就会抛出异常,因此加上异常处理十分必要。
try:
data = json.loads(raw_data)
....
except JSONDecodeError as err:
print('JSONDecodeError: {}'.format(err))
不过,有一点切记,我们不能走向另一个极端——滥用异常处理。
比如,当你想要查找字典中某个键对应的值时,绝不能写成下面这种形式:
d = {'name': 'jason', 'age': 20}
try:
value = d['dob']
...
except KeyError as err:
print('KeyError: {}'.format(err))
诚然,这样的代码并没有 bug,但是让人看了摸不着头脑,也显得很冗余。如果你的代码中充斥着这种写法,无疑对阅读、协作来说都是障碍。因此,对于 flow-control(流程控制)的代码逻辑,我们一般不用异常处理。
字典这个例子,写成下面这样就很好。
if 'dob' in d:
value = d['dob']
...

总结

这节课, 我们一起学习了 Python 的异常处理及其使用场景,你需要重点掌握下面几点。
异常,通常是指程序运行的过程中遇到了错误,终止并退出。我们通常使用 try except 语句去处理异常,这样程序就不会被终止,仍能继续执行。
处理异常时,如果有必须执行的语句,比如文件打开后必须关闭等等,则可以放在 finally block 中。
异常处理,通常用在你不确定某段代码能否成功执行,也无法轻易判断的情况下,比如数据库的连接、读取等等。正常的 flow-control 逻辑,不要使用异常处理,直接用条件语句解决就可以了。

思考题

最后,给你留一个思考题。在异常处理时,如果 try block 中有多处抛出异常,需要我们使用多个 try except block 吗?以数据库的连接、读取为例,下面两种写法,你觉得哪种更好呢?
第一种:
try:
db = DB.connect('<db path>') # 可能会抛出异常
raw_data = DB.queryData('<viewer_id>') # 可能会抛出异常
except (DBConnectionError, DBQueryDataError) err:
print('Error: {}'.format(err))
第二种:
try:
db = DB.connect('<db path>') # 可能会抛出异常
try:
raw_data = DB.queryData('<viewer_id>')
except DBQueryDataError as err:
print('DB query data error: {}'.format(err))
except DBConnectionError as err:
print('DB connection error: {}'.format(err))
欢迎在留言区写下你的答案,还有你今天学习的心得和疑惑,也欢迎你把这篇文章分享给你的同事、朋友。
分享给需要的人,Ta购买本课程,你将得18
生成海报并分享

赞 40

提建议

上一篇
07 | 修炼基本功:条件与循环
下一篇
09 | 不可或缺的自定义函数
unpreview
 写留言

精选留言(93)

  • 不瘦到140不改名
    2019-05-27
    老师,看到异常这一讲,忽然想起了一个问题,一直困扰着我 e = 1 try: 1 / 0 except ZeroDivisionError as e: pass print(e) # NameError: name 'e' is not defined 这里为什么会显示e没有被定义呢?
    展开

    作者回复: 你可以阅读官方文档:https://docs.python.org/3/reference/compound_stmts.html#the-try-statement "When an exception has been assigned using as target, it is cleared at the end of the except clause." 比如下面这个code block: except E as N: foo 就等于 except E as N: try: foo finally: del N 因此你例子中的e最后被delete了,所以会抛出NameError

    共 6 条评论
    156
  • Hoo-Ah
    2019-05-27
    第一种写法更加简洁,易于阅读。而且except后面的错误类型先抛出数据库连接错误,之后才抛出查询错误,实现的异常处理和第二种一样。

    作者回复: 正解

    共 2 条评论
    89
  • Geek_b6f316
    2019-05-27
    第一种方法简单明了,是不是少了一个as
    共 1 条评论
    35
  • Fergus
    2019-05-28
    选择1,原因有2: 1. 从开始学就如①这么写的; 2. ②读起来太难受,太不pythonic; 读了留言后意识到: 3. ①与②的运行逻辑一致,①可以看作②的简化版; 4. ②的写法,如出现异常,多次调用异常处理,降低程序运行效率; 多谢小伙伴们👍
    展开
    23
  • liput
    2019-05-27
    想请问老师,在facebook里面开发,对于异常处理有什么规范需要遵循吗?自定义异常、抛异常、捕获异常,粒度一般怎么把控呢? 与此相应的,我对日志输出也有同样的疑问,希望老师能结合您在大公司里的实战经验多讲讲。

    作者回复: 我会在最后一章里对大公司开发的规范,流程做一个详细的介绍。通常来说,异常能用内置的exception就用,如果需要自定义就自定义,看实际的需求。一般来说异常抛出,我们都会对其进行Log(一般每1000次log一次),输出到real time的table和dashboard里,这样有利于之后的分析和改进。

    共 3 条评论
    15
  • Howard
    2019-10-24
    1, 2我还是有点纠结,虽然明显第1优于2,但是2有一个好处就是可以根据错误定义自己的异常信息。所以个人觉得第3种更好。 try: db = DB.connect('<db path>') raw_data = DB.queryData('<viewer_id>') except DBConnectionError as err: print('DB connection failed {}'.format(err)) except DBQueryDataError as err: print('DB query failed {}'.format(err))
    展开
    9
  • 太平湖-燃气(DUYANG...
    2019-05-31
    什么是flow-control。。
    共 2 条评论
    5
  • 大飞守角
    2019-07-11
    思考题: 第一种比较好,第二种多层嵌套 还有,文章中举的例子,字典我一般获取使用 d.get("bob", None)这种方式,不会报异常,没有直接返回None
    5
  • alan
    2019-05-27
    老师好,相比try-catch的错误处理模式,您觉得Golang那样的返回error的错误处理方式怎么样?您更喜欢哪种错误处理方式?
    共 1 条评论
    4
  • John Si
    2019-05-27
    1. 第一種寫法比第二種寫法簡潔 2. 因我對try語法執行流程不太清楚,還是老師跟熟悉該同學多講解一下。但我自己想法是第二種寫法跟巢狀迴圈寫法很像,假設是第二句語法發生錯誤,第二種寫法會多執行一次try 語句,從而增加了程序運行時間。 綜上所述,我認為第一種寫法較第二種好
    展开

    作者回复: 正解

    4
  • 汤尼房
    2019-05-28
    第一种方式会更好,try代码段中的代码按顺序执行,若db = DB...这行代码抛出异常,则except语句将会捕获该异常,代码将直接跳转到except代码段中,而raw_data = DB...则不会被执行。若db = DB...没抛出异常,而raw_data抛出异常,except语句依然会将抛出的异常捕获。所以当try block中有多处抛出异常时,第二种方式并不会一次执行均会将所有存在的异常都抛出来,而是和第一种方式一样的线性执行,遇到异常,except便会将其捕获,出现异常语句后面的语句则不会再执行。因此,两者效果是一样的,且第一种方式显得更加有条理,更加简洁,清晰,所以觉得第一种方式会更好一些。
    展开
    共 1 条评论
    3
  • yllopy
    2019-06-03
    在用finally中用f.close()前建议加上一条判断:if ‘f’ in locals() 用以避免在f被赋值前发生异常而没有被定义导致的二次异常。
    2
  • Geek_41743c
    2019-05-28
    dict取值是不是用get()比较好。
    2
  • third
    2019-05-27
    小白提问 针对06思考的第一问,分次读取文件 读取完成一个很大的文件之后,这些文件存放在哪里? 如果这个文件大到了无法一次读取内存,那么他是否应该存储在磁盘中?在需要用的时候,又从磁盘中调取呢? 希望老师解释一下
    展开
    2
  • 小豹子
    2019-05-27
    老师,系统异常,非系统异常能举个例子说明下吗?

    作者回复: 系统异常比如说keyboardInterrupt

    2
  • Python高效编程
    2019-05-27
    第一种方式清晰一点
    2
  • Paul Shan
    2019-11-14
    异常是正常的反面,是程序代码非常规路径的跳转,是我初学编程时避之不及的类型。随着编程经验的增加,这种多处跳转,一处处理的模式有其价值。 我个人觉得静态语言处理简单的错误状态更为高效简洁。例如kotlin语言引入了nullable类型以后,对于创建型的函数可以用null来代表错误状态,这样可以在编译阶段强制处理主要的错误状态。
    1
  • helloworld
    2019-05-29
    老师,对文中的自定义异常不太理解,为什么要主动去raise自定义异常,有啥意义吗
    共 2 条评论
    1
  • 无才不肖生
    2019-05-28
    老师,想问个题外题 对象的属性是个字典,django中要根据属性里字典的某个键值查询该怎么做呢,如下面的,我想直接根据companyType来查询过滤记录 person { IDCard:12345678901, name:emily companys: companyName:'阿里', companyType:'电商' }
    展开
    1
  • SCAR
    2019-05-27
    应该是第一种情况更优: 1. 从实现的功能来看第一种和第二种都能达到,不过程序里两种异常是线性依次的,所以完全可以并行写在一个except里,再者python里的标准异常都__str__处理过,是完全可以区分哪个异常发生的。 2. 但就像the zen of python里强调的那样,简单和清晰是 python代码应该遵从的,显然第一种更优。
    展开
    1