2020年高教社杯全国大学生数学建模竞赛题目

(请先阅读“全国大学生数学建模竞赛论文格式规范”)

 

B题   穿越沙漠

 

考虑如下的小游戏:玩家凭借一张地图,利用初始资金购买一定数量的水和食物(包括食品和其他日常用品),从起点出发,在沙漠中行走。途中会遇到不同的天气,也可在矿山、村庄补充资金或资源,目标是在规定时间内到达终点,并保留尽可能多的资金。(bk1)

游戏的基本规则如下:(rsc1s)

(1)以天为基本时间单位,游戏的开始时间为第0天,玩家位于起点。玩家必须在截止日期或之前到达终点,到达终点后该玩家的游戏结束。

(2)穿越沙漠需水和食物两种资源,它们的最小计量单位均为箱。每天玩家拥有的水和食物质量之和不能超过负重上限。若未到达终点而水或食物已耗尽,视为游戏失败。

(3)每天的天气为“晴朗”、“高温”、“沙暴”三种状况之一,沙漠中所有区域的天气相同。

(4)每天玩家可从地图中的某个区域到达与之相邻的另一个区域,也可在原地停留。沙暴日必须在原地停留。

(5)玩家在原地停留一天消耗的资源数量称为基础消耗量,行走一天消耗的资源数量为基础消耗量的                             倍。

(6)玩家第0天可在起点处用初始资金以基准价格购买水和食物。玩家可在起点停留或回到起点,但不能多次在起点购买资源。玩家到达终点后可退回剩余的水和食物,每箱退回价格为基准价格的一半。

(7)玩家在矿山停留时,可通过挖矿获得资金,挖矿一天获得的资金量称为基础收益。如果挖矿,消耗的资源数量为基础消耗量的倍;如果不挖矿,消耗的资源数量为基础消耗量。到达矿山当天不能挖矿。沙暴日也可挖矿。

(8)玩家经过或在村庄停留时可用剩余的初始资金或挖矿获得的资金随时购买水和食物,每箱价格为基准价格的2倍。

请根据游戏的不同设定,建立数学模型,解决以下问题。

1.
假设只有一名玩家,在整个游戏时段内每天天气状况事先全部已知,试给出一般情况下玩家的最优策略。求解附件中的“第一关”和“第二关”,并将相应结果分别填入Result.xlsx。(spm1)

2.
假设只有一名玩家,玩家仅知道当天的天气状况,可据此决定当天的行动方案,试给出一般情况下玩家的最佳策略,并对附件中的“第三关”和“第四关”进行具体讨论。(spm2)

3.
现有名玩家,他们有相同的初始资金,且同时从起点出发。若某天其中的任意名玩家均从区域A行走到区域B(),则他们中的任一位消耗的资源数量均为基础消耗量的倍;若某天其中的任意名玩家在同一矿山挖矿,则他们中的任一位消耗的资源数量均为基础消耗量的倍,且每名玩家一天可通过挖矿获得的资金是基础收益的;若某天其中的任意名玩家在同一村庄购买资源,每箱价格均为基准价格的倍。其他情况下消耗资源数量与资源价格与单人游戏相同。

(1)假设在整个游戏时段内每天天气状况事先全部已知,每名玩家的行动方案需在第天确定且此后不能更改。试给出一般情况下玩家应采取的策略,并对附件中的“第五关”进行具体讨论。(spm3)

(2)假设所有玩家仅知道当天的天气状况,从第天起,每名玩家在当天行动结束后均知道其余玩家当天的行动方案和剩余的资源数量,随后确定各自第二天的行动方案。试给出一般情况下玩家应采取的策略,并对附件中的“第六关”进行具体讨论。(spm4)

 

注1:附件所给地图中,有公共边界的两个区域称为相邻,仅有公共顶点而没有公共边界的两个区域不视作相邻。

注2:Result.xlsx中剩余资金数(剩余水量、剩余食物量)指当日所需资源全部消耗完毕后的资金数(水量、食物量)。若当日还有购买行为,则指完成购买后的资金数(水量、食物量)。

 

点评:

 

我看到这题后,只有一个想法,就是我好想回到十年前,亲自带着队友把这道题做一遍呀!上一次有这种感觉还是看到一道关于植物大战僵尸和QQ农场相关策略的题的时候,真是太有意思了!

 

显然,这是一个优化问题,而且机理定义相对明确,接近于一个数值成长类的游戏,没有那些恼人难算的微积分。我们只需要按照函数观点定义清楚优化问题的4个方面,就很容易解决了。

 

一共4个题目其实是同一个问题新增两个维度难度的组合,一个是已知的信息从全局到仅仅当天,一个是人数变多称为一个组合优化问题。我们分别来看,从基础的开始:

 

X:初始水和实物量,以及每一天的行动是停留还是行走的行为序列;

Para:每一天在特定的位置,特定的天气下,需要的消耗和补给量;

Y:剩余资金

F:初始资金 – sum(每日净消耗资金)

Restriction:序列行为可行(比如沙暴不可走等),序列结束后能到达终点。

 

这样看来,这是一个标准的网络模型,每个地点就是网络节点,我们需要决策每一步我们应该如何选择,这个问题显然是一个WFST模型,状态包括所在的位置,剩余资源,当日天气,输入为行为选择,dirta函数是会进入的新状态结果。其中选择和天气是无关的,只会影响到接下来的位置条件。求解的话,用标准的动态规划就能完成。

 

拓展1:仅知道当天天气。那么此时,接下来天气的情况就只能以概率分布来给出,因此所有的路径最优决策都变成了分布上求得的期望的最优,而且,因为有可能一直出恶劣天气,所以不一定每一条选择都一定可以到达重点,这里的损失也必须规划进去,最后求得一条在到达率和每条到达的金钱损耗最小中的折中优化结果。

 

拓展2:玩家人数变为k,这样优化的对象状态就不再是单个点,而是一个点的元组,在每一天已知他们的位置分布,来共同决定在某天气下怎样共同决策才对大家的目标更有利,因为他们的损益是相互之间有所关联的。最后的优化目标则和前面一致。

 

当然最后一问是1,2两个拓展的结合,思路没变,只是计算稍微复杂了一点而已。

 

好了,我就先讲到这里,同学们加油!

技术
今日推荐
阅读数 6394
阅读数 1794
阅读数 1484
阅读数 1258
阅读数 1197
阅读数 1132
下载桌面版
GitHub
百度网盘(提取码:draw)
Gitee
云服务器优惠
阿里云优惠券
腾讯云优惠券
华为云优惠券
站点信息
问题反馈
邮箱:ixiaoyang8@qq.com
QQ群:766591547
关注微信