点击蓝色“
五分钟学算法
”关注我哟
加个“
星标
”,天天中午 12:15,一起学算法
作者 | labuladong
来源 | labuladong
今天要聊一个很经典的算法问题,若干层楼,若干个鸡蛋,让你算出最少的尝试次数,找到鸡蛋恰好摔不碎的那层楼。
国内大厂以及谷歌脸书面试都经常考察这道题,只不过他们觉得扔鸡蛋太浪费,改成扔杯子,扔破碗什么的。
具体的问题等会再说,但是这道题的解法技巧很多,光动态规划就好几种效率不同的思路,最后还有一种极其高效数学解法。
秉承咱们号一贯的作风,拒绝奇技淫巧,拒绝过于诡异的技巧,因为这些技巧无法举一反三,学了不太划算。
下面就来用我们一直强调的动态规划通用思路来研究一下这道题。
一、解析题目
题目是这样:你面前有一栋从 1 到
N
共
N
层的楼,然后给你
K
个鸡蛋(
K
至少为 1)。现在确定这栋楼存在楼层
0 <= F <= N
,在这层楼将鸡蛋扔下去,鸡蛋
恰好没摔碎
(高于
F
的楼层都会碎,低于
F
的楼层都不会碎)。现在问你,
最坏
情况下,你
至少
要扔几次鸡蛋,才能
确定
这个楼层
F
呢?
PS:
F
可以为 0,比如说鸡蛋在 1 层都能摔碎,那么
F = 0
。
也就是让你找摔不碎鸡蛋的最高楼层
F
,但什么叫「最坏情况」下「至少」要扔几次呢?我们分别举个例子就明白了。
比方说
现在先不管鸡蛋个数的限制
,有 7 层楼,你怎么去找鸡蛋恰好摔碎的那层楼?
最原始的方式就是线性扫描:我先在 1 楼扔一下,没碎,我再去 2 楼扔一下,没碎,我再去 3 楼……
以这种策略,
最坏
情况应该就是我试到第 7 层鸡蛋也没碎(
F = 7
),也就是我扔了 7 次鸡蛋。
现在你应该理解什么叫做「最坏情况」下了,
鸡蛋破碎一定发生在搜索区间穷尽时
,不会说你在第 1 层摔一下鸡蛋就碎了,这是你运气好,不是最坏情况。
现在再来理解一下什么叫「至少」要扔几次。依然不考虑鸡蛋个数限制,同样是 7 层楼,我们可以优化策略。
最好的策略是使用二分查找思路,我先去第
(1 + 7) / 2 = 4
层扔一下:
如果碎了说明
F
小于 4,我就去第
(1 + 3) / 2 = 2
层试……
如果没碎说明
F
大于等于 4,我就去第
(5 + 7) / 2 = 6
层试……
以这种策略,
最坏
情况应该是试到第 7 层鸡蛋还没碎(
F = 7
),或者鸡蛋一直碎到第 1 层(
F = 0
)。然而无论那种最坏情况,只需要试
log7
向上取整等于 3 次,比刚才的 7 次要少,这就是所谓的
至少
要扔几次。
PS:这有点像 Big O 表示法计算算法的复杂度。
实际上,如果不限制鸡蛋个数的话,二分思路显然可以得到最少尝试的次数,但问题是,
现在给你了鸡蛋个数的限制
K
,直接使用二分思路就不行了
。
比如说只给你 1 个鸡蛋,7 层楼,你敢用二分吗?你直接去第 4 层扔一下,如果鸡蛋没碎还好,但如果碎了你就没有鸡蛋继续测试了,无法确定鸡蛋恰好摔不碎的楼层
F
了。这种情况下只能用线性扫描的方法,算法返回结果应该是 7。
有的读者也许会有这种想法:二分查找排除楼层的速度无疑是最快的,那干脆先用二分查找,等到只剩 1 个鸡蛋的时候再执行线性扫描,这样得到的结果是不是就是最少的扔鸡蛋次数呢?
很遗憾,并不是,比如说把楼层变高一些,100 层,给你 2 个鸡蛋,你在 50 层扔一下,碎了,那就只能线性扫描 1~49 层了,最坏情况下要扔 50 次。
如果不要「二分」,变成「五分」「十分」都会大幅减少最坏情况下的尝试次数。比方说第一个鸡蛋每隔十层楼扔,在哪里碎了第二个鸡蛋一个个线性扫描,总共不会超过 20 次。
最优解其实是 14 次。最优策略非常多,而且并没有什么规律可言。
说了这么多废话,就是确保大家理解了题目的意思,而且认识到这个题目确实复杂,就连我们手算都不容易,如何用算法解决呢?
二、思路分析
对动态规划问题,直接套我们以前多次强调的框架即可:这个问题有什么「状态」,有什么「选择」,然后穷举。
「状态」很明显,就是当前拥有的鸡蛋数
K
和需要测试的楼层数
N
。随着测试的进行,鸡蛋个数可能减少,楼层的搜索范围会减小,这就是状态的变化。
「选择」其实就是去选择哪层楼扔鸡蛋
。回顾刚才的线性扫描和二分思路,二分查找每次选择到楼层区间的中间去扔鸡蛋,而线性扫描选择一层层向上测试。不同的选择会造成状态的转移。
现在明确了「状态」和「选择」,
动态规划的基本思路就形成了
:肯定是个二维的
dp
数组或者带有两个状态参数的
dp
函数来表示状态转移;外加一个 for 循环来遍历所有选择,择最优的选择更新结果 :
def dp(K, N):
int res
for 1 <= i <= N:
res = min(res, 这次在第 i 层楼扔鸡蛋)
return res
这段伪码还没有展示递归和状态转移,不过大致的算法框架已经完成了。
我们在第
i
层楼扔了鸡蛋之后,可能出现两种情况:鸡蛋碎了,鸡蛋没碎。
注意,这时候状态转移就来了
:
如果鸡蛋碎了
,那么鸡蛋的个数
K
应该减一,搜索的楼层区间应该从
[1..N]
变为
[1..i-1]
共
i-1
层楼;
如果鸡蛋没碎
,那么鸡蛋的个数
K
不变,搜索的楼层区间应该从
[1..N]
变为
[i+1..N]
共
N-i
层楼。
PS:
细心的读者可能会问,在第
i
层楼
扔鸡蛋如果没碎,楼层的搜索区间缩小至上面的楼层,是不是应该包含第
i
层楼
呀?不必,因为已经包含了。开头说了
F
是可以等于 0 的,向上递归后,
第
i
层楼其实就
相当于第 0 层,可以被取到,所以说并没有错误。
因为我们要求的是
最坏情况
下扔鸡蛋的次数,所以鸡蛋在第
i
层楼碎没碎,取决于那种情况的结果
更大
:
def dp(K, N):
for 1 <= i <= N:
res = min(res,
max(
dp(K - 1, i - 1),
dp(K, N - i)
) + 1
)
return res
递归的 base case 很容易理解:当楼层数
N
等于 0 时,显然不需要扔鸡蛋;当鸡蛋数
K
为 1 时,显然只能线性扫描所有楼层:
def dp(K, N):
if K == 1: return N
if N == 0: return 0
...
至此,其实这道题就解决了!只要添加一个备忘录消除重叠子问题即可:
def superEggDrop(K: int, N: int):
memo = dict()
def dp(K, N) -> int:
if K == 1: return N
if N == 0: return 0
if (K, N) in