17｜选路算法：Dijkstra是如何解决最短路问题的？

Jan 18, 2022

17｜选路算法：Dijkstra是如何解决最短路问题的？-业务开发算法50讲-极客时间



下载APP





关闭

渠道合作

推荐作者

17｜选路算法：Dijkstra是如何解决最短路问题的？

黄清昊 · 业务开发算法50讲

课程介绍



讲述：黄清昊

时长14:25大小13.16M



你好，我是微扰君。
在掌握操作系统中的一些经典算法之后，我们来学习计算机的另一大基础课——计算机网络中的算法。计算机网络，当然也是一个历史悠久的科研方向，可以说之所以现在计算机世界如此繁荣，计算机网络发挥着巨大的作用，是整个互联网世界的基石。
复杂的计算机网络中自然也产生了许多算法问题，比如许多经典的图论算法都是在计算机网络的研究背景中诞生的。在这一章我们会挑选几个有趣的问题一起讨论，主要涉及两种场景，计算机网络网络层的选路算法、传输层协议 TCP 中的滑动窗口思想。
今天我们先来学习选路算法，有时它也被称为路由算法，“路由”这个词相信你应该很熟悉，没错，说的就是路由器里的路由。
路由我们知道，计算机网络的作用，就是通过把不同的节点连接在一起从而交换信息、共享资源，而各个节点之间也就通过网络形成了一张拓扑关系网。
比如在一个局域网下，节点 A 要给节点 B 发送一条消息，如果 A 和 B 并没有直接通过网络相连，可能就需要经过其他路由设备的几次转发，这时我们需要在整个网络拓扑图中找到一条可到达的路径，才能把消息发送到目的地。
每台路由器都是一台网络设备，也就是网络中的一个节点，在其中就保存有一张路由表，每次网卡收到包含目标地址的数据包（packet）时，就会根据路由表的内容决定如何转发数据。
你的电脑也是一个网络上的一个节点，我们在 Mac 上通过命令就可以看到自己节点的路由表：
netstat -nr
我本地获取到的路由表如下：
Routing tables
Internet:
Destination        Gateway            Flags        Netif Expire
default            192.168.1.1        UGSc           en0
127                127.0.0.1          UCS            lo0
127.0.0.1          127.0.0.1          UH             lo0
169.254            link#6             UCS            en0      !
192.168.1          link#6             UCS            en0      !
192.168.1.1/32     link#6             UCS            en0      !
192.168.1.1        f4:1c:95:6d:c0:e8  UHLWIir        en0   1125
192.168.1.7/32     link#6             UCS            en0      !
192.168.1.7        3c:22:fb:94:7:cf   UHLWI          lo0
192.168.1.8        22:6:ba:99:db:c5   UHLWIi         en0    847
192.168.1.11       f6:f0:14:1b:9f:68  UHLWIi         en0   1002
192.168.1.12       ae:ea:e4:f2:a4:69  UHLWI          en0   1063
224.0.0/4          link#6             UmCS           en0      !
224.0.0.251        1:0:5e:0:0:fb      UHmLWI         en0
239.255.255.250    1:0:5e:7f:ff:fa    UHmLWI         en0
255.255.255.255/32 link#6             UCS            en0      !
路由表的每一行都代表一条路由规则，至少会包括两个信息，也就是路由表的前 2 列：
目标网络地址（Destination）：标示 IP 包要去往的目标网络
下一跳地址（Gateway）：与当前路由器相邻的路由器，命中这条规则的数据包应该经由这个路由器转发去往最终目的地
这里的后 3 列我也顺带简单介绍一下，flag 是路由的一些信息，netif 指的是网络物理接口，expire 代表过期时间，你感兴趣的话可以去查阅 Linux 手册详细了解。
因为每个数据包里包含了目标地址，所以路由器工作的基本原理就是，网卡基于路由表匹配数据包对应的规则，转发到下一跳的路由器直至抵达终点就可以了。
路由表那这个路由表怎么来呢？主要有两种方式。
一种就是我们手动管理配置。Linux 提供了简单的配置命令，既可以根据路由 IP 配置路由表，也可以基于一定的策略配置，查阅 Linux 手册即可。这种方式也被称为静态路由表，最早期的网络就是这样由网络管理员手动配置的。但如果网络结构发生变化，手工修改的成本就非常高。
为了解决这种问题，第二种方式——动态路由表就应运而生，它可以根据协议在网络中通过节点间的通信自主地生成，网络结构变化时，也会自动调整。
而生成动态路由表的算法，就是我们的选路算法。所以，选路算法所做的事情就是，构建一个动态路由表，帮每个数据包都选择一条去目标 IP 最快的路径。
那在路由选路问题中，什么是最快路径呢？
我们知道信息在网络上传输肯定是需要经过物理传输的，各设备之间的距离以及不同设备本身的网络连接情况都是不同的，都会影响节点间传输的时间。如果我们把不同节点之间的通信时间当作距离，整个拓扑图上搜索最快路径的过程，其实就等价于求图上的最短路问题。
求解最短路的算法，相信你也学过不少了，比如基于 BFS 的 SPFA、基于贪心思想的 Dijkstra、基于动态规划思想的 Bellman-Ford 等算法。这些算法在选路问题中也有应用，最经典的两种就是基于 Dijkstra 实现的链路状态算法和基于 Bellman-Ford 实现的距离矢量算法。
今天我们就来先学习鼎鼎大名的 Dijkstra 算法，看看它是如何解决最短路问题的（链路状态算法和距离矢量算法在后两讲学习）。
Dijkstra 算法Dijkstra 算法是一个非常经典的求解单源最短路 (Single Source Shortest Path) 问题的算法，但它有一个巨大的限制：只能用于没有权重为负的边的图。
在分析这一限制之前，我们还是先来严谨地定义一下最短路问题。
假设我们有一张图 G=(V,E)，图中共有 v 个节点，它们之间有 e 条无向边。其中，各节点的集合用 V 表示，边的集合用 E 表示，边权 weight 就代表该边两点之间的距离。
单源最短路问题就是要在这张图上求出从源点 s 到图上任意其他点的距离最短的路径，一条路径的长度 / 距离大小就是这条路径上所有边的权重和。具体怎么做呢？
估计你也想到了，一个比较直觉的思路就是贪心思想，我们从离 s 最近的点开始记录，然后找次之的点、再次之点，逐步推进。
我们先找出距离源点 s 最近的节点
它一定是和 s 直接相连的节点中距离最近的一个，这是因为所有和 s 构成二度关系的节点都会经过一个和 s 直接相连的节点，距离不会短于这个直接相连的节点，所以这个节点一定是所有节点中到 s 距离最近的节点，我们把这第一个节点记录为 v1。
然后再找出距离 s 次近的节点
这时刚找到的 v1 就有可能成为次短路径的一部分了，我们需要在和 s、v1 直接相邻的节点中，再次找出除了 v1 之外到 s 距离最短的节点，它一定是剩余节点中到 s 最近的节点。
依次类推，就可以求出 s 到所有节点的最短路径了
Dijkstra 算法其实就是这样做的，它引入了一种叫做最短路径树的构造方法。按照刚才说的基于贪心的思想逐步找出距源点 s 最近、次近的点，就能得到一个 G 的子图，里面包含了 s 及所有从 s 出发能到达的节点，它们以 s 为根一起构成了一颗树，就是最短路径树。找到了这颗树，我们自然也就求出了 s 到所有节点的最短距离和路径了。
思路为了把我们刚才直觉的想法用编程语言更精确的描述出来，需要引入一种叫做“松弛（relax）”的操作，结合例子来讲解这个过程。
假设现在有了一张有向图 G，其中包含了 0、1、2、3、4 这 5 个节点，节点之间的边权代表距离，都标在图上了，比如节点 0 和节点 1 之间的边权 / 距离是 2。
假设 0 节点是源点 s，我们如何构造出这棵以 s 为根的最短距离树 T 呢？
整个构造过程是一步步从原点向外扩张的，我们可以用一个数组 dis 标记源点 s 到其他节点的距离。由于刚开始树 T 中只有根节点 s，此时：
大部分不和 s 直接相邻的节点到 s 的距离都是未知的，我们可以暂时记录为 Inf，代表无限大；
和 T 直接相邻的节点就是我们的候选节点，在最开始时也就是 s 的所有邻节点。我们每次从中选择距离 s 最短的一个节点加入树 T 中，只需要遍历所有节点到 s 的距离就可以得到这个节点，我们记作 u。
比如对于节点 0 而言，1 就是目前候选集里到 s 最近的节点。
那每次挑出最短节点 u 加入 T 中之后，T 的候选集显然就多了一些选择，u 的所有相邻的节点以及它们到树的距离都可以被发现了。
但 u 的邻节点 v，到源点 s 的距离有两种可能。
第一种情况 dis[v] = Inf，代表这个节点 v 还没有被加入过候选集中，也就是之前和源点 s 不直接相邻。
比如图中从 1 节点搜索 4 节点的时候就是这种情况。我们可以把 v 加入 T 中，并记录 dis[v] = dis[u]+edge[u][v]，这很显然是目前发现的、能到 v 的最短距离，但它依旧有可能在后续遍历过程时被更新，我们叫做“松弛操作”。
第二种情况 dis[v]!=inf，这说明 v 已经被加入到候选集中了，也意味着之前有其他路径可以到达 v。
这个时候，我们要比较一下经由 u 到达 v 是不是一条更短的路径，判断 dis[u]+edge[u][v] 是否小于 dis[v]，如果小于就要更新 dis[v] = dis[u] + edge[u][v]。比如图中从 1 节点搜索 3 节点的时候就是这种情况。
更新的操作其实就是“松弛”，不过我个人觉得“松弛”不是一个很好理解的说法，因为松弛操作实际上是让这条路径变得更短，不过因为 Dijkstra 是用“relax”来描述这个更新操作的；所以我们也翻译成松弛操作。
我们再来一起结合例子梳理一遍搜索的全过程。
在整个构造过程中会依次把 0、1、3、2、4 节点入队，入队时，它们都是候选集到 s 中距离最短的节点。
在没有负边的情况下，这就保证了剩余的节点距离一定长于这个节点，也就不会出现入队之后节点距离仍然需要更新的情况，每个加入树中节点的距离在加入的那一刻就已经被固定了。
入队的时候，我们也探索到了一些可能和树相接且到 s 更近的节点，需要对它们进行“松弛”，并加入候选集合。
比如 0-3 节点的距离开始是 7：但在 1 节点加入候选集之后，我们就可以经由 1 去往 3，这时 3 到 0 的距离就会被更新为 5，而不再是 7 了；这个时候 3 节点（0-1-3）已经是所有剩余节点中到 s 最近的节点了，我们把它加入树中，dis[3]=5 也不会有机会再被其他节点更新了。
代码理解了这个过程，翻译成代码也就比较简单了，力扣上的743 网络延迟时间就是一道典型的最短路应用题，有多种解法。
这个题正好是建立在网络的场景下的，求从源点 s 出发把消息广播到所有节点的时间，节点之间的边就代表着网络传输的延时，也就是求 s 到图上所有节点最短距离的最大值。
用我们今天学的 Dijkstra 算法就可以求解，实现代码贴在这里供你参考：
class Solution {
public:
    int networkDelayTime(vector<vector<int>>& times, int n, int k) {
        // 标记未被探索的节点距离
        const int inf = INT_MAX / 2;
        // 邻接表
        vector<vector<int>> g(n, vector<int>(n, inf));
        // 构图
        for (auto time: times) {
            g[time[0] - 1][time[1] - 1] = time[2];
        }
        vector<int> dist(n, inf); // 所有节点未被探索时距离都初始化为无穷
        vector<bool> used(n, false); // 标记是否已经被加入树中
        dist[k - 1] = 0; // 记录原点距离为0
        
        for (int i = 0; i < n; ++i) {
            int x = -1;
            // 找出候选集中到S距离最短的节点
            for (int y = 0; y < n; ++y) {
                if (!used[y] && (x == -1 || dist[y] < dist[x])) {
                    x = y;
                }
            }
            // 加入树中
            used[x] = true;
            // 基于x 对所有x的邻节点进行松弛操作
            for (int y = 0; y < n; ++y) {
                dist[y] = min(dist[y], dist[x] + g[x][y]);
            }
        }
        
        // 取出最短路中的最大值
        int ans = *max_element(dist.begin(), dist.end());
        return ans == inf ? -1 : ans;
    }
};
代码中的 dist 用于标记距离，used 用于标记树中的节点，每次我们都会从候选节点中挑选出到 s 最短的节点，并基于它对其邻节点进行“松弛”操作；等整个最短路问题求解完毕，最后再从所有距离中取出最大值就可以了。
时间复杂度也很好分析，整个代码中一共有两层循环，外层循环就是每次把一个节点加入树中，一共进行 n 次；内层循环有两段，分别用于找出最短节点和对所有邻居进行“松弛”操作，最多也不会超过 2*n 次计算。所以，整体时间复杂度为 O(n^2)。
总结网络路由算法，核心就是在动态变化的网络中，基于探测和寻找最快传输路径的想法，帮助路由器建立路由表，让每个数据包都可以快速且正确地传播到正确目的地。
首先我们需要想办法解决最短路的问题，Dijkstra 就是这样一种在没有负边的图中求解单源最短路的算法，基于贪心的思想，我们构造一颗最短路径树就可以求出从源点到网络中所有节点的最短路径了。核心的就是松弛操作，每次加入一个最短节点之后，我们还需要基于它去探索一遍和它相临的节点是否距离更短，比如从不可达变成可达，或者从一条更长的路变成一条更短的路。
Dijkstra 算法实现起来还是有一定难度的，你可以多去力扣上找几道题目练手检验一下学习效果；另一个有效的检验方式就是参考费曼学习法，你可以试着给你的朋友讲一下为什么 Dijkstra 算法不支持负边，这也是 Dijkstra 算法非常重要的一个约束，如果能讲清楚你也就理解精髓了。
有了 Dijkstra 算法，我们也就可以求解网络路由中的最短路问题了。后两讲学习我们将学习最经典两种路由的算法：基于 Dijkstra 算法实现的链路状态算法、基于 Bellman-Ford 实现的距离矢量算法。
课后作业最后也给你留一个简单的课后思考题。我们分析了 Dijkstra 算法的时间复杂度为 O(N^2)，你觉得是不是可以有更快的写法呢？
欢迎你在留言区与我讨论，如果你觉得本文有帮助，也欢迎你分享给你的朋友一起学习。我们下节课见～
参考资料每个数据包里包含了目标地址，具体还有哪些内容，你可以去补习一下计算机网络的基础内容，推荐学习 UW 的计算机网络课。

Dijkstra算法是解决最短路问题的经典算法之一，主要用于计算机网络中的选路算法。该算法通过贪心思想逐步找出距离源点最近、次近的点，构建最短路径树，从而求出源点到所有节点的最短距离和路径。然而，Dijkstra算法有一个限制，即只能用于没有权重为负的边的图。文章通过引入“松弛”操作来描述Dijkstra算法的过程，并给出了相关的代码实现。此外，文章还提到了Dijkstra算法的时间复杂度为O(N^2)，并引出了对更快写法的思考。总的来说，本文介绍了Dijkstra算法的原理、实现和应用，对于想要深入了解最短路算法的读者来说，是一篇值得阅读的文章。

分享给需要的人，Ta购买本课程，你将得18元

生成海报并分享

2022-01-18

赞 2

提建议

16｜日志型文件系统：写入文件的时候断电了会发生什么？

18｜选路算法：链路状态算法是如何分发全局信息的

 写留言

全部留言(3)

最新
精选

Paul Shan
2022-01-18
Dijkstra 算法是逐步构建最短路径树，树中的节点的最短距离不依赖于树外节点，这样才可以一个节点加入最短路径树之后，距离不再改变。负权节点的存在会让加入最短路径树的节点的真实最短路径会因为不在树中的节点而改变，整个算法也就无效了。如果用最小堆作为数据结构选择最短路径，可以让内存循环的复杂度降为lg V，最终的复杂度可以降为(V+E)lg V
作者回复: 说的非常好耶！大佬加个wx吧: constant_variation
3
ZeroIce
2022-02-14
有时候在想:负权边的意义是什么? 应用场景在哪里?🤪
作者回复: 非常不错的问题。事实上，在现实生活中有许多能用图抽象的问题都会用到负权边。比如，我们将边定义成到达某个状态所需要的开销；有时候我们需要花费一定的费用到达某个状态；而有的时候会有人支付我们一定的费用。一个很好的例子就是某个司机开往某些地方能赚到一定钱或者支付一定的公路费用。如果我们为了求出从A点出发到B点的最小成本；当走过某段路可以获得收入的时候，该边就可以被抽象为负权边。
1
到道可道
2022-03-06
Dijkstra的Java实现 private int dijkstra(List<int[]>[] graph, int src, int k, int dst) { // 从起点src到达节点i的最短路径权重为distTo[i] int[] distTo = new int[graph.length]; // 定义：从起点src到节点i，至少要经过nodeNumTo[i]个节点 int[] nodeNumTo = new int[graph.length]; Arrays.fill(distTo, Integer.MAX_VALUE); Arrays.fill(nodeNumTo, Integer.MAX_VALUE); // base case distTo[src] = 0; nodeNumTo[src] = 0; // 优先队列，costFromSrc较小的排在前面 Queue<State> pq = new PriorityQueue<>((a, b) -> a.costFromSrc - b.costFromSrc); // 从起点src开始进行BFS pq.offer(new State(src, 0, 0)); while (!pq.isEmpty()) { State curState = pq.poll(); int curId = curState.id; int curCostFromSrc = curState.costFromSrc; int curNodeNumFromSrc = curState.nodeNumFromSrc; if (curId == dst) { // 找到最短路径 return curCostFromSrc; } if (curNodeNumFromSrc == k) { // 中转次数耗尽 continue; } // 将curId 的相邻节点装入队列 for (int[] neighbor : graph[curId]) { int nextId = neighbor[0]; int costToNextNode = curCostFromSrc + neighbor[1]; // 中转次数 int nextNodeNumFromSrc = curNodeNumFromSrc + 1; // 更新dp table if (distTo[nextId] > costToNextNode) { distTo[nextId] = costToNextNode; nodeNumTo[nextId] = nextNodeNumFromSrc; } // 剪枝 if (costToNextNode > distTo[nextId] && nextNodeNumFromSrc > nodeNumTo[nextId]) { continue; } pq.offer(new State(nextId, costToNextNode, nextNodeNumFromSrc)); } } return -1; }
展开
作者回复: 写得很好感兴趣可以来 github.com/wfnuser/Algorithms 提个 pr

