leetcode刷题专题打卡——分治法

关于分治法

引文

MapReduce(分治算法的应用) 是 Google 大数据处理的三驾马车之一,另外两个是 GFS 和 Bigtable。它在倒排索引、PageRank 计算、网页分析等搜索引擎相关的技术中都有大量的应用。

尽管开发一个 MapReduce 看起来很高深,感觉遥不可及。实际上,万变不离其宗,它的本质就是分治算法思想,分治算法。如何理解分治算法?为什么说 MapRedue 的本质就是分治算法呢?

主要思想

分治算法的主要思想是将原问题递归地分成若干个子问题,直到子问题满足边界条件,停止递归。将子问题逐个击破(一般是同种方法),将已经解决的子问题合并,最后,算法会层层合并得到原问题的答案。

和动态规划相比,分治法是一种二分的递归算法,例如,要解决4,先解决1、1、1、1,然后在这基础上解决2、2,然后再解决4,而动态规划是“叠加式”算法,例如,要解决4,先解决1,然后2,然后3,然后再4

分治法的步骤

  • 分:递归地将问题分解为各个的子问题(性质相同的、相互独立的子问题);
  • 治:将这些规模更小的子问题逐个击破
  • 合:将已解决的子问题逐层合并,最终得出原问题的解;

img

分治法适用的情况

  • 原问题的计算复杂度随着问题的规模的增加而增加。
  • 原问题能够被分解成更小的子问题。
  • 子问题的结构和性质与原问题一样,并且相互独立,子问题之间不包含公共的子子问题。
  • 原问题分解出的子问题的解可以合并为该问题的解。

伪代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
def divide_conquer(problem, paraml, param2,...):
# 不断切分的终止条件
if problem is None:
print_result
return
# 准备数据
data=prepare_data(problem)
# 将大问题拆分为小问题
subproblems=split_problem(problem, data)
# 处理小问题,得到子结果
subresult1=self.divide_conquer(subproblems[0],p1,..…)
subresult2=self.divide_conquer(subproblems[1],p1,...)
subresult3=self.divide_conquer(subproblems[2],p1,.…)
# 对子结果进行合并 得到最终结果
result=process_result(subresult1, subresult2, subresult3,...)

举个栗子

通过应用举例分析理解分治算法的原理其实并不难,但是要想灵活应用并在编程中体现这种思想中却并不容易。所以,这里这里用分治算法应用在排序的时候的一个栗子,加深对分治算法的理解。

相关概念:

  • 有序度:表示一组数据的有序程度
  • 逆序度:表示一组数据的无序程度

一般通过计算有序对或者逆序对的个数,来表示数据的有序度或逆序度。

假设我们有 n 个数据,我们期望数据从小到大排列,那完全有序的数据的有序度就是 $n(n-1)/2$,逆序度等于 0;相反,倒序排列的数据的有序度就是 0,逆序度是 $n(n-1)/2$。

Q:如何编程求出一组数据的有序对个数或者逆序对个数呢?

因为有序对个数和逆序对个数的求解方式是类似的,所以这里可以只思考逆序对(常接触的)个数的求解方法。

  • 方法1
    • 拿数组里的每个数字跟它后面的数字比较,看有几个比它小的。
    • 把比它小的数字个数记作 k,通过这样的方式,把每个数字都考察一遍之后,然后对每个数字对应的 k 值求和
    • 最后得到的总和就是逆序对个数。
    • 这样操作的时间复杂度是$O(n^2)$(需要两层循环过滤)。那有没有更加高效的处理方法呢?这里尝试套用分治的思想来求数组 A 的逆序对个数。
  • 方法2
    • 首先将数组分成前后两半 A1 和 A2,分别计算 A1 和 A2 的逆序对个数 K1 和 K2
    • 然后再计算 A1 与 A2 之间的逆序对个数 K3。那数组 A 的逆序对个数就等于 K1+K2+K3。
    • 注意使用分治算法其中一个要求是,子问题合并的代价不能太大,否则就起不了降低时间复杂度的效果了。
    • 如何快速计算出两个子问题 A1 与 A2 之间的逆序对个数呢?这里就要借助归并排序算法了。(这里先回顾一下归并排序思想)如何借助归并排序算法来解决呢?归并排序中有一个非常关键的操作,就是将两个有序的小数组,合并成一个有序的数组。实际上,在这个合并的过程中,可以计算这两个小数组的逆序对个数了。每次合并操作,我们都计算逆序对个数,把这些计算出来的逆序对个数求和,就是这个数组的逆序对个数了。

Leetcode题解

169. 多数元素

  • 题目描述

    给定一个大小为 n 的数组,找到其中的众数。众数是指在数组中出现次数大于 [n/2] 的元素。

    你可以假设数组是非空的,并且给定的数组总是存在众数。

    示例 1:

    1
    2
    输入: [3,2,3]
    输出: 3

    示例 2:

    1
    2
    输入: [2,2,1,1,1,2,2]
    输出: 2
  • 解题思路

    • 确定切分的终止条件

      直到所有的子问题都是长度为 1 的数组,停止切分。

    • 准备数据,将大问题切分为小问题

      递归地将原数组二分为左区间与右区间,直到最终的数组只剩下一个元素,将其返回

    • 处理子问题得到子结果,并合并

      • 长度为 1 的子数组中唯一的数显然是众数,直接返回即可。
      • 如果它们的众数相同,那么显然这一段区间的众数是它们相同的值。
      • 如果他们的众数不同,比较两个众数在整个区间内出现的次数来决定该区间的众数

分治法解题代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
class Solution(object):
def majorityElement2(self, nums):
"""
:type nums: List[int]
:rtype: int
"""
# 【不断切分的终止条件】
if not nums:
return None
if len(nums) == 1:
return nums[0]
# 【准备数据,并将大问题拆分为小问题】
left = self.majorityElement(nums[:len(nums)//2])
right = self.majorityElement(nums[len(nums)//2:])
# 【处理子问题,得到子结果】
# 【对子结果进行合并 得到最终结果】
if left == right:
return left
if nums.count(left) > nums.count(right):
return left
else:
return right

结果不太理想:

官方思路

哈希表

我们使用哈希映射(HashMap)来存储每个元素以及出现的次数。对于哈希映射中的每个键值对,键表示一个元素,值表示该元素出现的次数。

我们用一个循环遍历数组 nums 并将数组中的每个元素加入哈希映射中。在这之后,我们遍历哈希映射中的所有键值对,返回值最大的键。我们同样也可以在遍历数组 nums 时候使用打擂台的方法,维护最大的值,这样省去了最后对哈希映射的遍历。

1
2
3
4
5
6
7
8
9
class Solution(object):
def majorityElement(self, nums):
"""
:type nums: List[int]
:rtype: int
"""

counts = collections.Counter(nums)
return max(counts.keys(), key=counts.get)

排序

如果将数组 nums 中的所有元素按照单调递增或单调递减的顺序排序,那么下标为 $\lfloor \dfrac{n}{2} \rfloor$ 的元素(下标从 0 开始)一定是众数。Python实现更为简单:

1
2
3
4
class Solution:
def majorityElement(self, nums):
nums.sort()
return nums[len(nums)//2]

复杂度分析

  • 时间复杂度:$O(n\log n)$。将数组排序的时间复杂度为 $O(n\log n)$。

  • 空间复杂度:$O(\log n)$。如果使用语言自带的排序算法,需要使用$O(\log n)$的栈空间。如果自己编写堆排序,则只需要使用 $O(1)$ 的额外空间。

运行结果很美丽:

随机化

因为超过$\lfloor \dfrac{n}{2}⌋$的数组下标被众数占据了,这样我们随机挑选一个下标对应的元素并验证,有很大的概率能找到众数。实现代码也很简单:

1
2
3
4
5
6
7
8
9
import random

class Solution:
def majorityElement(self, nums):
majority_count = len(nums)//2
while True:
candidate = random.choice(nums)
if sum(1 for elem in nums if elem == candidate) > majority_count:
return candidate

复杂度分析

时间复杂度:理论上最坏情况下的时间复杂度为$O(\infty)$,因为如果我们的运气很差,这个算法会一直找不到众数,随机挑选无穷多次,所以最坏时间复杂度是没有上限的。然而,运行的期望时间是线性的。为了更简单地分析,先说服你自己:由于众数占据超过数组一半的位置,期望的随机次数会小于众数占据数组恰好一半的情况。因此,我们可以计算随机的期望次数(下标为 prob 为原问题,mod 为众数恰好占据数组一半数目的问题):

计算方法为:当众数恰好占据数组的一半时,第一次随机我们有$\frac{1}{2}$的概率找到众数,如果没有找到,则第二次随机时,包含上一次我们有 $\frac{1}{4} $的概率找到众数,以此类推。因此期望的次数为$i * \frac{1}{2^i}$的和,可以计算出这个和为$2$,说明期望的随机次数是常数。每一次随机后,我们需要的时间判断这个数是否为众数,因此期望的时间复杂度为$O(n)$。

空间复杂度:$O(1)$。随机方法只需要常数级别的额外空间。

结果也不赖:

Boyer-Moore投票算法

这个算法具体内容可以戳github官方解答,Boyer-Moore 算法的本质和分治十分类似。我们首先给出 Boyer-Moore 算法的详细步骤:

  • 我们维护一个候选众数 candidate 和它出现的次数 count。初始时 candidate 可以为任意值,count 为 0;
  • 我们遍历数组 nums 中的所有元素,对于每个元素 x,在判断 x 之前,如果 count 的值为 0,我们先将 x 的值赋予 candidate,随后我们判断 x:

    • 如果 x 与 candidate 相等,那么计数器 count 的值增加 1;
    • 如果 x 与 candidate 不等,那么计数器 count 的值减少 1。
  • 在遍历完成后,candidate 即为整个数组的众数。

这个算法没有具体证明,但确实是空间复杂度和时间复杂度均最好的算法:

1
2
3
4
5
6
7
8
9
10
11
class Solution:
def majorityElement(self, nums):
count = 0
candidate = None

for num in nums:
if count == 0:
candidate = num
count += (1 if num == candidate else -1)

return candidate

复杂度分析

  • 时间复杂度:$O(n)$。Boyer-Moore 算法只对数组进行了一次遍历。

  • 空间复杂度:$O(1)$。Boyer-Moore 算法只需要常数级别的额外空间。

执行结果也蛮牛逼的:

53. 最大子序和

  • 题目描述

    给定一个整数数组 nums ,找到一个具有最大和的连续子数组(子数组最少包含一个元素),返回其最大和。

    示例:

    1
    2
    3
    输入: [-2,1,-3,4,-1,2,1,-5,4],
    输出: 6
    解释: 连续子数组 [4,-1,2,1] 的和最大为6。
  • 解题思路

    • 确定切分的终止条件

      直到所有的子问题都是长度为 1 的数组,停止切分。

    • 准备数据,将大问题切分为小问题

      递归地将原数组二分为左区间与右区间,直到最终的数组只剩下一个元素,将其返回

    • 处理子问题得到子结果,并合并

      • 将数组切分为左右区间
        • 对与左区间:从右到左计算左边的最大子序和
        • 对与右区间:从左到右计算右边的最大子序和
      • 由于左右区间计算累加和的方向不一致,因此,左右区间直接合并相加之后就是整个区间的和
      • 最终返回左区间的元素、右区间的元素、以及整个区间(相对子问题)和的最大值

分治法解题代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
class Solution(object):
def maxSubArray(self, nums):
"""
:type nums: List[int]
:rtype: int
"""
# 【确定不断切分的终止条件】
n = len(nums)
if n == 1:
return nums[0]

# 【准备数据,并将大问题拆分为小的问题】
left = self.maxSubArray(nums[:len(nums)//2])
right = self.maxSubArray(nums[len(nums)//2:])

# 【处理小问题,得到子结果】
# 从右到左计算左边的最大子序和
max_l = nums[len(nums)//2 -1] # max_l为该数组的最右边的元素
tmp = 0 # tmp用来记录连续子数组的和

for i in range( len(nums)//2-1 , -1 , -1 ):# 从右到左遍历数组的元素
tmp += nums[i]
max_l = max(tmp ,max_l)

# 从左到右计算右边的最大子序和
max_r = nums[len(nums)//2]
tmp = 0
for i in range(len(nums)//2,len(nums)):
tmp += nums[i]
max_r = max(tmp,max_r)

# 【对子结果进行合并 得到最终结果】
# 返回三个中的最大值
return max(left,right,max_l+ max_r)

50. Pow(x, n)

  • 题目描述

    实现 pow(x, n),即计算 xn 次幂函数。

    示例 1:

    1
    2
    输入: 2.00000, 10
    输出: 1024.00000

    示例 2:

    1
    2
    输入: 2.10000, 3
    输出: 9.26100

    示例 3:

    1
    2
    3
    输入: 2.00000, -2
    输出: 0.25000
    解释: 2^-2 = (1/2)^2 = 1/4 = 0.25

    说明:

    -100.0 < x < 100.0 n是 32 位有符号整数,其数值范围是$[−2^{31}, 2^{31} − 1] $。

  • 解题思路

    • 确定切分的终止条件

      n不断除以2,并更新n,直到为0,终止切分

    • 准备数据,将大问题切分为小问题

      n不断除以2,更新

    • 处理子问题得到子结果,并合并

      • x与自身相乘更新x
      • 如果$n\%2 ==1$
        • p乘以x之后赋值给p(初始值为1),返回p
    • 最终返回p

分治法解题代码 (快速幂+递归)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
class Solution(object):
def myPow(self, x, n):
"""
:type x: float
:type n: int
:rtype: float
"""
# 处理n为负的情况
if n < 0 :
x = 1/x
n = -n
# 【确定不断切分的终止条件】
if n == 0 :
return 1

# 【准备数据,并将大问题拆分为小的问题】
if n%2 ==1:
# 【处理小问题,得到子结果】
p = x * self.myPow(x,n-1)# 【对子结果进行合并 得到最终结果】
return p
return self.myPow(x*x,n/2)

快速幂 + 迭代

具体解析可以见Leetcode官方解答,这里仅简要说明。

那么

这样一来,我们从$x$开始不断平方,得到$x^2,x^4, x^8, x^{16},…$,如果$n$的第$k$个(从右往左数)二进制位为1,那么我们将对应的$x^{2^k}$计入答案累乘,代码实现为:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
class Solution:
def myPow(self, x: float, n: int):
def quickMul(N):
ans = 1.0
# 贡献的初始值为 x
x_contribute = x
# 在对 N 进行二进制拆分的同时计算答案
while N > 0:
if N % 2 == 1:
# 如果 N 二进制表示的最低位为 1,那么需要计入贡献
ans *= x_contribute
# 将贡献不断地平方
x_contribute *= x_contribute
# 舍弃 N 二进制表示的最低位,这样我们每次只要判断最低位即可
N //= 2
return ans

return quickMul(n) if n >= 0 else 1.0 / quickMul(-n)

参考链接:

  • 版权声明: 本博客所有文章除特别声明外,著作权归作者所有。转载请注明出处!

扫一扫,分享到微信

微信分享二维码
  • Copyrights © 2020 chenk
  • 由 帅气的CK本尊 强力驱动
  • 访问人数: | 浏览次数:

请我喝杯咖啡吧~

支付宝
微信