图丨OpenAIFive开发团队
本场比赛为BO1比赛,即以一轮决胜负。 OpenAIFive对阵来自南美赛区的Pain Gaming(PG)。这支队伍是本届TI 18支队伍中第一支被淘汰的队伍。
OpenAIFive对战的规则是:没有Ban选择回合,双方阵容已经确定,通过猜币决定哪一方。机器的操作反应时间为0.2秒后。这是因为人类有反射弧,而机器没有。加入延迟操作后,游戏将更加公平。
本场比赛是OpenAIFive首次在最先进的DOTA2比赛中与人类职业选手以5对5的形式进行对抗。 OpenAI选定的阵容为直升机、巫妖、死亡先知、冰女、潮汐猎人; PG选择的阵容是恶魔法师、瘟疫法师、巫医、狙击手、斧头。
图片丨Pain Gaming(PG)战队
比赛才刚刚开始,PG就利用诡计之雾拿到了潮汐猎手的一血。这还不是全部。 OpenAIFive 在其底部塔旁边插入了一只真正的眼睛。事实上,防御塔有自己的真实愿景。 OpenAIFive 的做法是对团队资源的浪费。
比赛进行到2分钟左右,OpenAIFive的中单Tidehunter回家补满状态。大约4分钟后,OpenAIFive的直升机与PG的巫医发生冲突,导致双方死亡。从这次对抗中可以看出,OpenAIFive计算伤害非常准确,直升机的最后一击刚好足以击杀巫医。
6 分钟后,在潮汐猎人上购买了外观之尘。这是探测隐身的消耗品,但PG的阵容中没有英雄可以使用隐身技能。
OpenAIFive在8分钟时集结下路三人,完成了瘟疫法师的击杀。最神奇的是,直升机非常准确地掌握了对方的攻击力,在对方只剩下7滴血的情况下将对方击杀。
第10分钟,双方战平。狙击手经济4500,全游戏第一。并列第二名的是PG 的Axeman 和OpenAIFive 的死亡先知。
OpenAIFive从早期就非常注重杀戮,但在经济发展方面却远远落后。从第13分钟开始,OpenAIFive选择集结5人从中路推进,并选择利用诡计迷雾追击PG选手。前者从中路追至下路,完成了1换3。
15分钟,OpenAIFive再次集结5人晋级,这次他们的目标是下塔。此次推动的结果超出了预期。 OpenAIFive不仅攻下了下路二塔,还击杀了对方的狙击手和斧头。
OpenAIFive会给出双方获胜的概率。从现场图表来看,整场比赛电脑胜率接近100%。
比赛进行到20分钟时,利奇对中路孤身狙击手使用了大招。但巫妖的大招只有在人多的情况下才有效。两分钟后,PG的Axe使用闪光匕首进行偷袭。即使计算机设置了0.2秒的反应时间,这种人类不可能反应的操作仍然被计算机避免了。
图丨截至比赛中期,PG已处于经济领先
讽刺的是,作为OpenAIFive 2号位的潮汐猎人,此时的经济已经成为队伍倒数第二。
在视野方面,OpenAIFive存在严重的bug。除了上面提到的防御塔下方插有真眼外,机器还在主基地旁边插了真眼和假眼,旁边还有两座具有真实视野的防御塔。
30分钟,OpenAIFive再次击杀Roshan。但拿走复活盾和奶酪的人却是经济排名游戏第六的巫妖。一般来说,复活盾和奶酪会放在队伍的1号位和2号位手中。
当比赛进入中后期时,OpenAIF突然改变了战斗方式。前期他们非常喜欢击杀对方的英雄,但现在OpenAIFive开始补充兵力并清理丛林区域。 33分钟,中路的死亡先知在对方视野之外释放了大招。
第34分钟,死亡先知使用Eul的圣杖躲开了Axe的战吼。这让评论员认为操作应该更长一些,但仍然显得不平衡。 36分钟,OpenAIFive被PG队灭掉,死亡先知和潮汐猎手双双被击杀。
PG此时选择攻击对方高地,潮汐猎手此时选择购买生命,死亡先知在没有敌人的情况下再次释放大招。
截至40分钟,OpenAIFive的快递员已被杀两次。随后双方爆发团战,斧头的技能依然被对方利用装备和技能躲避。现场解说再次吐槽0.2秒的延迟。
40分钟,OpenAIFive选择攻击肉山。死亡先知虽然购买了大勋章装备,但并没有用在肉山身上。然后机器在其古老的丛林区域中连续插入了两只人造眼睛。每个视觉道具的视野不能叠加,因此两只义眼等于一只。
43分钟,死亡先知在没有敌人的情况下第三次释放大招。
图丨OpenAIFive杀戮量领先
44 分钟时,OpenAIFive 领先对手11 人杀,但在财务上落后更多。现场评论员认为,OpenAIFive主要赢在运营上。即时反应操作让斧王、恶魔巫师等有施法时间的英雄无用武之地,所以操作延迟设置为0.2秒。这需要讨论。
46分钟,冰女上路停止操作,被路过的斧王单杀。 48分钟,活买的飞机再次被击杀,复活时间115秒。此时,OpenAIFive判定PG的胜率为75%。
51分钟,OpenAIF三路高地被攻破,四人没能买到性命就死了。 PG在第52分钟取得胜利。
游戏后期的局势终于掌握在人类手中。没有人能够惩罚已成型的火枪。失去AI的考验后,游戏的乐趣也随之下降。人工智能虽然展现出不少亮点,但距离人类顶尖水平还有很大距离。球员之间的差距不容忽视。
值得注意的是,整场比赛,人方NEC和Axe也存在前期大招误判,没能拿下对手的问题。跳刀的第一招,就被对方以惊人的延迟躲开了。如果这样无可挑剔的操作都交给人类玩家的意识和局势判断能力来掌控,关键技能不再那么随手交出,那么人类玩家可能就没有机会了。
根据大数据预测分析,AI方大部分时间都给出了90%以上的胜率,随后一波又一波地跌落至70%,在50分钟时给出了30%的逆转结果。最终的结果是,经过53分钟的激战,人类赢得了比赛。
DOTA 2 是一款困难的游戏。它要求选手在比赛中展现出团队精神、战略思维和极快的反应能力。 OpenAI花了很长时间探索如何“战胜”DOTA 2,并于2017年8月在TI7首次亮相。在中路SOLO模式中,它使用暗影恶魔击败了Navi的职业选手Dendi,引发了很大的争议。专注于。然而,当时OpenAI虽然击败了职业选手Dendi,但那场比赛的设定非常有限,因此无法代表真正的比赛。
但今年,通过完善和调整机器学习系统所需的硬件和计算能力,OpenAI 突破了许多限制,缩小了人类与机器之间的竞争差距。
2018年6月,OpenAI开发的AI能够组队并在5V5比赛中击败业余DOTA 2玩家。这些玩家的平均天梯分数超过了4200分。匹兹堡卡内基梅隆大学研究员诺姆·布朗曾表示:“DOTA2是一款极其复杂的游戏,击败强大的业余玩家并不容易。而且,处理像DOTA2这样的大型游戏中隐藏的信息是一个挑战。挑战。”
到了今年8月初,OpenAI达到了新的巅峰:其五系统以2:1的成绩击败了人类队伍。这场比赛中人类玩家——Blitz、Cap、Fogged、Merlini和MoonMeander的平均水平超过了99.95%的DOTA玩家,其中四人参加过专业比赛。值得一提的是,当时的第三场比赛,观众故意为Five选择了较差的阵容,但OpenAI也在比赛中展示了球队的初步成果,比如Five对比赛的理解和对局势的判断。以及对获胜概率的预测,其中一些甚至是意想不到的。
这些结果表明,OpenAI 5 是迈向先进人工智能系统的一步,可以处理现实世界的复杂性和不确定性。
根据OpenAI 之前的介绍,OpenAI Five 由5 个单人、1024 个单元的长短期记忆(LSTM)网络组成,每个网络的大小约为蚂蚁的大脑。通过参加大量比赛熟悉了DOTA2相关技能,每天在训练中获得了长达180年的游戏经验,相当于5个AI总共有900年的经验,这是人类团队的东西永远无法实现。
OpenAI 使用—— 强化学习(一种机器学习方法)来创建人工智能。这项技术看似简单,但它可以让人工智能学习非常复杂的行为。让AI学习的过程就是将AI放入虚拟环境中,通过自己尝试来学习实现目标。开发者可以设置奖励机制(比如在AI杀死敌人后奖励机器的系统),然后让AI一遍又一遍地玩游戏。
这些DOTA 机器人的自我训练量令人难以置信,并且会连续训练数月。研究人员表示:“它一开始在地图上徘徊,但是几个小时后,它就开始掌握基本技能。如果一个人需要12,000 到20,000 小时才能成为一名职业游戏玩家,那么AI 的速度要快得多更重要的是,因为每天积累的游戏经验是人一生经验的100倍。”
OpenAI通常的开发流程是从头开始训练每个版本的系统。不过,OpenAI 5自6月9日以来已经经历了6次大版本改版,每个新版本的系统在训练前都会使用上一个版本的参数进行初始化。具体来说,OpenAI 团队投入巨资开发了一种名为“surgery”的迭代训练工具,使模型能够将旧参数映射到新的网络架构。
例如,在第一次训练病房(Dota术语)时,使用共享动作头来确定英雄的移动方向和病房位置。但Five 倾向于将目光集中在它想要走的方向上,团队推测这主要是因为OpenAI Five 将大部分计算能力分配给了运动。然后,团队使用“手术”工具将动作头分成两个相同的动作头,并使用相同的参数对它们进行初始化。
图丨可视化模块展示了OpenAI Five在每个英雄被选中后的预期获胜概率
6 月下旬,OpenAI 团队开始在系统中添加了一个获胜概率的输出,使得OpenAI Five 能够反馈和修正预测的内容。当后来考虑征召模式时,团队意识到可以用这一概率来估计任一阵容的获胜概率——仅在比赛最开始看一下双方选的阵容就可以了。在接下来的一周内,OpenAI 团队自行模拟了1100 多万个可能的英雄阵容的画面输入给Five 系统,并写了一个搜索树(数据结构)来寻找OpenAI Five 的最佳阵容选择策略。
从6 月击败4000 分到8 月碾压7000 分,OpenAI 还通过一种名为近端策略优化(Proximal Policy Optimization)的强化学习算法进行训练。在六月的比赛中,该系统更是通过Google Cloud 消耗了惊人的128,000 个CPU 内核和256 个Nvidia P100 GPU。
据估计,训练这一DOTA 系统需要的资源如下(注:1 petaflop/s-days 是指一天执行每秒1015 次神经网络操作,或总计1020 次操作):
1v1 模型l:8 petaflop/s-days
6 月6 日的模型:40 petaflop/s-days
8 月5 日的模型:190 petaflop/s-days
据OpenAI 官方博客介绍,8 月份的新模型中,输出可以预测英雄在未来一段时间的预计位置。以下视频就突出显示了Sven 在6 秒后的预测位置:
标签:
用户评论
哇,AI竟然被人类玩家打败了,看来技术再先进也敌不过人类智慧啊!DOTA2的世界太精彩了。
有17位网友表示赞同!
这新闻太酷了!人类战胜AI,是不是说明我们还有无限的潜力可以挖掘呢?AI被“折磨”得服服帖帖的。
有5位网友表示赞同!
哈哈,AI被人类玩家打败,真是让人眼前一亮。不过,这也让我想起了那句老话,强中自有强中手。
有13位网友表示赞同!
DOTA2顶级职业赛人类战胜AI,这说明我们人类在游戏领域的创新能力还是相当强的。AI再厉害,终究敌不过人类的智慧。
有17位网友表示赞同!
这新闻让我感慨万分,AI被人类玩家折磨,看来我们人类还是有着不可估量的力量啊!太激动了。
有8位网友表示赞同!
AI被人类玩家“折磨”,这真是游戏史上的一大突破。不过,我也担心AI技术发展会被限制。
有7位网友表示赞同!
DOTA2顶级职业赛人类战胜AI,这让我想起了自己曾经和AI对战的日子。那时候的挫败感,现在想想真是好笑。
有5位网友表示赞同!
人类战胜AI,这真是让人振奋的消息。不过,我也担心以后AI技术进步,我们人类会不会被自己创造出来的东西取代。
有16位网友表示赞同!
AI被人类玩家“折磨”,这让我想到了我们人类的创造力。只要有心,就没有什么是不可能的。
有6位网友表示赞同!
DOTA2顶级职业赛人类战胜AI,这让我对人类智慧有了更深的认识。AI再强大,也敌不过我们的智慧和努力。
有20位网友表示赞同!
AI被人类玩家打败,这说明我们在游戏领域的发展速度还是很快的。不过,AI技术的研究也不能放松啊。
有15位网友表示赞同!
这新闻让我想起了自己小时候玩电脑游戏的日子。那时候,AI还是那么强大,现在看来真是感慨万千。
有14位网友表示赞同!
人类战胜AI,这让我对人类的前景充满了信心。只要我们不断创新,就没有什么是不可能的。
有20位网友表示赞同!
DOTA2顶级职业赛人类战胜AI,这让我看到了我们人类的无限可能。AI再厉害,也敌不过我们的智慧和勇气。
有17位网友表示赞同!
AI被人类玩家“折磨”,这真是让人感慨。看来,我们人类还是有着不可战胜的力量。
有5位网友表示赞同!
人类战胜AI,这让我想起了那句老话,人定胜天。只要我们努力,就没有什么是不可能的。
有18位网友表示赞同!
DOTA2顶级职业赛人类战胜AI,这让我对人类的未来充满了期待。我们人类,永远都是最强大的。
有9位网友表示赞同!
AI被人类玩家“折磨”,这让我看到了人类的不屈精神。只要我们坚持不懈,就能战胜一切困难。
有6位网友表示赞同!
DOTA2顶级职业赛人类战胜AI,这让我对人类在游戏领域的未来发展充满了信心。AI再强大,也敌不过我们的智慧。
有5位网友表示赞同!