Dijkstra 算法的局限性
上一篇文章中,我给你留下一个思考题:
Dijkstra 算法可以处理所有情况下的最短路径问题吗?
你的答案是什么呢?如果是不是,那么恭喜你,你答对了。
那么在什么情况下, Dijkstra 算法不再适用呢?我们一起来看一个具体的例子。
假设有6个人,分别是 A 、B 、C 、D 、E 、F 。他们每个人都有一个十分珍爱的东西,除非用他们自己所认为的等价的东西交换,否则一般情况下,他们是不卖这些东西的。
有一天,A 突然想要用自己所珍爱的东西换取 F 的东西。于是, A 边和 F 商量,自己的东西是否能作为交换的等价物。可是,非常遗憾, F 看不上 A 的东西,并不同意。
故事到了这里,并没有结束。 A 非常执( nan )着( chan ), F 被他的精神打动了,做出一定的妥协。 F 说,如果你能用你的东西换到 C 的东西,并且加上 1 块钱,我就和你换。
A 非常激动,跑去找 C 。结果也是被拒。直接交换不成功,那么就间接交换吧, A 如是提议着。C 想了想,自己也有想要拥有其他人的一些东西,便提出了自己的要求:如果你能换到 E 的东西,我能返你 6 快钱;如果你能换到 B 的东西,那么还要在加上 1 块钱。
A 又去找 B 、E 商量,他们也提出了自己的要求。
最终 A 把这些信息化成一张图,构成如下所示的交换贸易网:
那么,现在问题来了, A 如何能画最少的钱,用自己的东西换到 F 的东西呢?
仔细分析题目中抽象出的交换网以及问题,这不就是在求有权图(或者是网)中,从某一点到另一点的最短路径方案嘛,直接用 Dijkstra 算法就能解决!
我们把这里的网输入交给 Dijkstra 算法计算一下,它的输出又是什么呢?
1 | # 输出结果 |
惊了!该算法怎么没走含有负数的路径,原本代价可以更小的!那这个算法究竟哪里存在不足呢?仔细分析一下, Dijkstra 算法在寻找最短路径时,是存在一些“短见”的。它考虑最短路径是依据起点到当前点的最短距离加上该点到其邻居节点的距离。依据这个和,找到和最小的邻居结点,并选择这个点作为下一个点。在这种情况下,它并不会考虑到下几个结点的和会出现更小的情况。以上面的例子来说,在到达B时,算法在选择 C 或者 E 作为下一个最短路径的结点时,更倾向于贪心地选择下一个结点代价更小的 C ,而不会选择下两个结点和会更小的 E 。
那为什么上次在计算最短路径时, Dijkstra 算法表现的十分出色呢?原来在所有边的权值都为正数时,是不会出现上述情况的。所以 Dijkstra 算法在边权值为负数的时候,可能会出现错误。
那么对于负数边的图,怎样计算其中的最短路径呢?这就要用到 Floyd 算法。
Floyd 算法1
试想有一个图,它有 N 个顶点,编号从 1 到 N 。我们设 shortestPath(i, j, k) 为一条最短路径,这条最短路径从 i 出发 到 j 为止,并且中间只经过 {1, 2, ···, k} 这些点。那么图上的最短路径问题即可描述为,对于每一个 i 、 j 对, 寻找它们之间的最短路径,其中间路径只通过 {1, 2, ···, N} ,也就是对每一组 i, j ,求 shortestPath(i, j, N) 。
对 shortestPath(i, j, k) 这个式子的含义进一步分析,不难发现,它的结果不外乎两种情况:
- 路径并不通过顶点 k (也就是可用顶点集合为 {1, 2, ···, k-1} )
- 路径通过顶点 k (路径先从 i 开始,到 k 暂停;再从 k 开始,最终到达终点 j 。其中间只经过 {1, 2, ···, k-1} )
将上述两点,结合开头的定义将这个问题进一步化简,对于 shortestPath(i, j, k) ,它可能的解可以用如下式子表示
- shortestPath(i, j, k-1)
- shortestPath(i, k, k-1) + shortestPath(k, j, k-1)
也就是
\[ \begin{aligned} shortestPath(i, j, k) = min(&shortestPath(i, j, k-1),\\ &shortestPath(i, k, k-1) + shortestPath(k, j, k-1) ) \end{aligned} \] 上述式子是一个递推公式,那么它一定有一个起始值。在这里,k = 0 条件下的值便是它的起始值。用公式便可表示如下:
\[ shortestPath(i, j, 0) = w(i, j) \]
这种情况下,为 i 和 j 两点直接相连。其中, w(i, j) 为顶点为 i 、j 边上的权值。
将上述两个式子写到一起,便是
\[ shortestPath(i, j, k) = \left \{ \begin{aligned} & w(i, j), &k = 0\\ & min \left ( \begin{aligned} &shortestPath(i, j, k-1),\\ &shortestPath(i, k, k-1) + shortestPath(k, j, k-1) \end{aligned} \right ) , &k > 0\\ \end{aligned} \right. \]
上式便是 Floyd 算法的核心公式。当算法运行时,对于每一组顶点 i 和顶点 j 的组合,计算每一个 k 取值情况下的 shortestPath 值。当用户查询时,只需从 shortestPath 中访问即可。
实现
这个算法如何实现呢?
我们先来看下维基百科上的伪代码描述
source2 1
2
3
4
5
6
7
8
9
10
11let dist be a |V| × |V| array of minimum distances initialized to ∞ (infinity)
for each edge (u,v)
dist[u][v] ← w(u,v) // the weight of the edge (u,v)
for each vertex v
dist[v][v] ← 0
for k from 1 to |V|
for i from 1 to |V|
for j from 1 to |V|
if dist[i][j] > dist[i][k] + dist[k][j]
dist[i][j] ← dist[i][k] + dist[k][j]
end if
以这个为基础,很容易将它转成 Python 代码:
1 | import numpy as np # 在你的终端命令行中输入 'pip install numpy' 命令安装numpy包。已经安装过的可以忽略 |
上述实现仅仅给出了最短路径长度,有时候我们更需要的是最短路径的方案。怎么办呢?
维基百科中进一步给出了如下的伪代码描述:
source3
1 | let dist be a |V| × |V| array of minimum distances initialized to ∞ |
所以有 Python 代码如下:
1 | import numpy as np # 在你的终端命令行中输入 'pip install numpy' 命令安装numpy包。已经安装过的可以忽略 |
上述的最终结果符合我们的预期。
复杂度分析
由于 Floyd 算法中存在一个非常消耗时间的三重循环,所以该算法的时间效率并不高,其时间复杂度为 \(O(N^{3})\) 。
总结
今天我从一个非常有意思的例子和你一起了解到 Dijkstra 算法的局限性,由此引出客服其局限性的 Floyd 算法,并且介绍了它的算法思想和算法实现。
最后,我将本文的要点总结如下:
- 在边权值全部为正数的图中求最短路径,适合使用 Dijkstra 算法;
- 在边权值存在负数的图中求最短路径,应该使用 Floyd 算法;
- Floyd 算法 的时间复杂度为 \(O(N^{3})\) 。
- Dijkstra 算法的时间复杂度为 \(O(N^{2})\) 。(这个小知识点,我上篇文章忘说了,你可以自己推导下)