动态规划_leetcode.486.预测赢家-物联网技术文章-傲云油气装备网

题目

给定一个表示分数的非负整数数组。玩家 1 从数组任意一端拿取一个分数，随后玩家 2 继续从剩余数组任意一端拿取分数，然后玩家 1 拿，…… 。每次一个玩家只能拿取一个分数，分数被拿取之后不再可取。直到没有剩余分数可取时游戏结束。最终获得分数总和最多的玩家获胜。

给定一个表示分数的数组，预测玩家1是否会成为赢家。你可以假设每个玩家的玩法都会使他的分数最大化。

示例 1：

输入：[1, 5, 2]
输出：False
解释：一开始，玩家1可以从1和2中进行选择。
如果他选择 2（或者 1 ），那么玩家 2 可以从 1（或者 2 ）和 5 中进行选择。如果玩家 2 选择了 5 ，那么玩家 1 则只剩下 1（或者 2 ）可选。
所以，玩家 1 的最终分数为 1 + 2 = 3，而玩家 2 为 5 。
因此，玩家 1 永远不会成为赢家，返回 False 。

示例 2：

输入：[1, 5, 233, 7]
输出：True
解释：玩家 1 一开始选择 1 。然后玩家 2 必须从 5 和 7 中进行选择。无论玩家 2 选择了哪个，玩家 1 都可以选择 233 。
     最终，玩家 1（234 分）比玩家 2（12 分）获得更多的分数，所以返回 True，表示玩家 1 可以成为赢家。

提示：

1 <= 给定的数组长度 <= 20.
数组里所有分数都为非负数且不会大于 10000000 。
如果最终两个玩家的分数相等，那么玩家 1 仍为赢家。

分析

首先分析就是使用递归

方法一：暴力递归（正常思路）

	public boolean PredictTheWinner(int[] nums) {
		// 模拟真实情况下，A，B轮流选牌的过程，求出结果
		return dfs(0, nums.length - 1, 0, 0, true, nums);
	}
	//分别为 左边可取的位置，右边可取的位置，A的得分，B的得分， 轮到谁选牌， nums数组
	private static boolean dfs(int left, int right, int sumA, int sumB, boolean to_A, int[] nums) {
		// TODO Auto-generated method stub
		if(left > right) {//左右越界，没有牌了，比较得分，判断胜负（以A为主角）
			return sumA >= sumB;
		}
		if(to_A) {//轮到A选牌,A是主角，只要左边或者右边有一种必胜情况，就说明可以必胜
			return dfs(left + 1, right, sumA + nums[left], sumB, false, nums) || dfs(left, right - 1, sumA + nums[right], sumB, false, nums);
		}else {//轮到B选牌，不管B怎么选，此时只有左右两边都保证A是必胜的，才能保证A最终必胜
			return dfs(left + 1, right, sumA, sumB+ nums[left], true, nums) && dfs(left, right - 1, sumA, sumB + nums[right], true, nums);
		}
	}

方法二：递归（思路一）

分析

为了判断哪个玩家可以获胜，需要计算一个总分，为先手得分与后手得分之差。当数组中的所有数字都被拿取时，如果总分大于或等于 0，则先手获胜，反之则后手获胜。

由于每次只能从数组的任意一端拿取数字，因此可以保证数组中剩下的部分一定是连续的。假设数组当前剩下的部分为下标start 到下标end，其中 0 ≤ start ≤ end < nums . length 0 \le \textit{start} \le \textit{end} < \textit{nums}.\text{length} 0≤start≤end<nums.length。如果 start = end \textit{start}=\textit{end} start=end，则只剩一个数字，当前玩家只能拿取这个数字。如果 start < end \textit{start}<\textit{end} start<end，则当前玩家可以选择$ nums [ start ] \textit{nums}[\textit{start}] nums[start]$ 或 nums [ end ] \textit{nums}[\textit{end}] nums[end]，然后轮到另一个玩家在数组剩下的部分选取数字。这是一个递归的过程。

计算总分时，需要记录当前玩家是先手还是后手，判断当前玩家的得分应该记为正还是负。当数组中剩下的数字多于 1 个时，当前玩家会选择最优的方案，使得自己的分数最大化，因此对两种方案分别计算当前玩家可以得到的分数，其中的最大值为当前玩家最多可以得到的分数。

    public boolean PredictTheWinner(int[] nums) {
        return total(nums, 0, nums.length - 1, 1) >= 0;
    }

    public int total(int[] nums, int start, int end, int turn) {
        if (start == end) {
            return nums[start] * turn;
        }
        int scoreStart = nums[start] * turn + total(nums, start + 1, end, -turn);
        int scoreEnd = nums[end] * turn + total(nums, start, end - 1, -turn);
        return Math.max(scoreStart * turn, scoreEnd * turn) * turn;
    }

方法三：递归（思路二）

分析

以 [1, 5, 233, 7] 为例，玩家 1 先手。

如果玩家 1 先选左端 1，则玩家 2 在 [5, 233, 7] 的两端中选。
如果玩家 1 先选右端 7，则玩家 2 在 [1, 5, 233] 的两端中选。

可以看到，每个节点都是其中一个玩家在选择。当前子问题下，谁的分数更多，谁就赢。

当前，你选了 x，得 x 分，他没选，得 0分，你赢了别人 x 分，接下来呢？他选，然后你选……你们交替地得分……打住，你已进入递归的细节，别想下去了。

当前你有 x 分，对手 0 分，在后面的游戏中，对手拢共超过你 y 分，如果 x >= y，那你赢咯。

别操心递归的细节，细节丢给子调用去做，眼睛盯着当前的 x 分，想想子调用应该返回什么，去和当前的 x 分作比较，判断出胜利。

于是，递归函数做的事：计算当前做选择的玩家能赢过对手的分数。如果大于零，则表示他在这个子问题中赢了。

怎么计算呢？当前选择的分数，减去，接下来对手赢过自己的分数（剩余数组的递归结果），因为选择有两种，所以我们二者取其大。

	public boolean PredictTheWinner2(int[] nums) {
		return help(0, nums.length - 1, nums) >= 0;
	}
	private static int help(int left, int right, int[] nums) {
		// TODO Auto-generated method stub
		if(left == right) {
			return nums[left];
		}
		int sumL = nums[left] - help(left + 1, right, nums); // 选择左端
		int sumR = nums[right] - help(left, right, nums);// 选择右端
		return Math.max(sumL, sumR);
	}

方法四：记忆化递归（思路优化）

分析

我们做了哪些重复的计算呢？
比如，你先选 1，我再选 7，和你先选 7，我再选 1，这两种所带来的子问题是一样的，都是剩下[5, 233]。我们用数组或哈希表去存储计算过的子问题的解，下次遇到重复的子问题，就不用再次递归计算。

	public static boolean PredictTheWinner3(int[] nums) {
		int len = nums.length;
		int[][] memo = new int[len][len];
		
		for(int i = 0; i < len; i++) {
			Arrays.fill(memo[i], Integer.MIN_VALUE);
		}
		
		return dfs2(nums, 0, len - 1, memo) >= 0;
	}
	public static int dfs2(int[] nums, int left, int right, int[][] memo) {
		if(left > right) {
			return 0;
		}
		
		if(memo[left][right] != Integer.MIN_VALUE) {
			return memo[left][right];
		}
		int Left = nums[left] - dfs2(nums, left + 1, right, memo);
		int Right = nums[right] - dfs2(nums, left, right - 1, memo);
		memo[left][right] = Math.max(Left, Right);
		return memo[left][right];
	}

方法五：动态规划

分析

定义二维数组 dp \textit{dp} dp，其行数和列数都等于数组的长度， dp [ i ] [ j ] \textit{dp}[i][j] dp[i][j]表示当数组剩下的部分为下标 i 到下标 j 时，当前玩家与另一个玩家的分数之差的最大值，注意当前玩家不一定是先手。

只有当 i ≤ j i \le j i≤j时，数组剩下的部分才有意义，因此当 i > j i>j i>j时， dp [ i ] [ j ] = 0 \textit{dp}[i][j]=0 dp[i][j]=0。

当 i=j时，只剩一个数字，当前玩家只能拿取这个数字，因此对于所有 0 ≤ i < nums . length 0 \le i < \textit{nums}.\text{length} 0≤i<nums.length，都有 dp [ i ] [ i ] = nums [ i ] \textit{dp}[i][i]=\textit{nums}[i] dp[i][i]=nums[i]。

当 i<j时，当前玩家可以选择 nums [ i ] \textit{nums}[i] nums[i] 或 nums [ j ] \textit{nums}[j] nums[j]，然后轮到另一个玩家在数组剩下的部分选取数字。在两种方案中，当前玩家会选择最优的方案，使得自己的分数最大化。因此可以得到如下状态转移方程：

dp [ i ] [ j ] = max ⁡ ( nums [ i ] − dp [ i + 1 ] [ j ] , nums [ j ] − dp [ i ] [ j − 1 ] ) \textit{dp}[i][j]=\max(\textit{nums}[i] - \textit{dp}[i + 1][j], \textit{nums}[j] -\textit{dp}[i][j - 1]) dp[i][j]=max(nums[i]−dp[i+1][j],nums[j]−dp[i][j−1])

最后判断 dp [ 0 ] [ nums . length − 1 ] \textit{dp}[0][\textit{nums}.\text{length}-1] dp[0][nums.length−1] 的值，如果大于或等于 0，则先手得分大于或等于后手得分，因此先手成为赢家，否则后手成为赢家。

	public static boolean PredictTheWinner4(int[] nums) {
		int len = nums.length;
		int[][] dp = new int[len][len];
		
		for(int i = 0; i < len; i++) {
			dp[i][i] = nums[i];
		}
		for(int i = len - 2; i >= 0; i--) {
			for(int j = i + 1; j < len; j++) {
				dp[i][j] = Math.max(nums[i] - dp[i + 1][j], nums[j] - dp[i][j - 1]);
			}
		}
		return dp[0][len - 1] >= 0;
	}

方法六：动态规划优化

分析

上述代码中使用了二维数组 dp \textit{dp} dp。分析状态转移方程可以看到， dp [ i ] [ j \textit{dp}[i][j dp[i][j 的值只和 dp [ i + 1 ] [ j ] \textit{dp}[i + 1][j] dp[i+1][j]与 dp [ i ] [ j − 1 ] \textit{dp}[i][j - 1] dp[i][j−1]有关，即在计算 dp \textit{dp} dp的第 ii 行的值时，只需要使用到 dp \textit{dp} dp的第 i 行和第 i+1 行的值，因此可以使用一维数组代替二维数组，对空间进行优化。

	public static boolean PredictTheWinner5(int[] nums) {
		int len = nums.length;
		int[] dp = new int[len];
		
		for(int i = 0; i < len; i++) {
			dp[i] = nums[i];
		}
		for(int i = len - 2; i >= 0; i--) {
			for(int j = i + 1; j < len; j++) {
				dp[j] = Math.max(nums[i] - dp[j], nums[j] - dp[j - 1]);
			}
		}
		return dp[len - 1] >= 0;
	}

• FreeRTOS+CubeMX系列第二篇——任务的创建与删	• 上海项目调研，走起，谈谈我这八年的经验
• 用于卫星信号载波的宽带频谱分析仪-新品发布（	• STM32F407 DP83848驱动调试过程总结（标准库到H
• 2020年深圳杯C题	• Golang导出并下载excel封装

• Esp8266天猫精灵_RGB灯_非点灯平台	• STM32F103 串口1和串口3对发数据配合蓝牙模块
• TMS570学习【1】了解什么是TMS570	• 新闻稿 \| Qt公司收购froglogic公司以巩固市场领
• [Java]SpringBoot2整合mqtt服务器EMQ实现消息订	• 苹果群控投屏同步操作原理及运用的平台APP分享

• Esp8266天猫精灵_RGB灯_非点灯平台	• STM32F103 串口1和串口3对发数据配合蓝牙模块
• TMS570学习【1】了解什么是TMS570	• 新闻稿 \| Qt公司收购froglogic公司以巩固市场领
• [Java]SpringBoot2整合mqtt服务器EMQ实现消息订	• 苹果群控投屏同步操作原理及运用的平台APP分享
• STM32查询式按键输入[直接用寄存器]	• Ubuntu系统 USB设备端口绑定
• 2021-04-14 第四次按键输入实验	• Flutter扫码功能完美实现

动态规划_leetcode.486.预测赢家

题目

分析