主页 > 游戏 > 正文

马斯克的OpenAI机器人完虐人类最强Dota2玩家

2017-08-13 17:14来源:新浪编辑:时寒峰

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

  原标题:马斯克的OpenAI机器人完虐人类最强Dota2玩家

  Dota2沦陷

  继横扫 的人类国际象棋大师和围棋大师后,计算机如今在风靡全球的电子游戏Dota2中战胜了 的职业玩家。此前未被披露的此场对决发生于Valve奖金高达2400万美元的Dota2国际邀请赛“The International”。

Dendi(图左)在赛前与 OpenAI 的 Greg Brockman(图右)交谈。

  Dendi(图左)在赛前与 OpenAI 的 Greg Brockman(图右)交谈。Dendi(图左)在赛前与 OpenAI 的 GregBrockman(图右)交谈。

  在这场一对一的对战中,OpenAI设计的一款机器人击败了职业玩家Danylo“Dendi”Ishutin,Dendi在此前的职业生涯中已赢得累计735449.4美元的奖金。OpenAI的机器人在首场对战中用时十分钟击败了Dendi,之后Dendi在第二局对战中退出并拒绝再战第三局。

  DendiDendi

Dendi

  “请放过我吧,”赛间Dendi对机器人对手这样说道。

  Elon Musk 发表推文称赞 OpenAI 的战绩,并其为“在电子竞技领域 击败人类 玩家的机器人”。  ElonMusk发表推文称赞OpenAI的战绩,并其为“在电子竞技领域 击败人类 玩家的机器人”。

  OpenAI在电子竞技领域首度击败人类 玩家。这比国际象棋及围棋等游戏要复杂得多。

  OpenAI的CTO Greg Brockman在赛前介绍称这一款机器人通过数千次的加以指导的自我对决进行训练,并称该机器人已经击败了数个Dota2的职业玩家。Brockman在博客中称:“过去几周内,我们的机器人已经战胜过包括SumaiL(世界 1v1选手)及Arteezy(世界 overall选手)等多个 玩家”。

  “自我对决”的理念是OpenAI研发的关键。这是一种AI系统学习解决极其复杂任务的有效方法:与太弱或太强的对手对战,它都无法从中学到东西,但自身反倒是有价值的对手。Brockman介绍道:“你可以看到AI从完全的随机状态一步步发展到如今的 水平”。

  AI公司惯常用电子竞技游戏来测试他们的技术,如谷歌的DeepMind攻克“星际2”,微软的AI团队今日则宣称他们在吃豆人游戏中获取高分。

  OpenAI并未打算就此停止征战的脚步。他们希望在明年的参与正式的五对五比赛。与此同时他们也对外发布了此机器人,所以任何人有兴趣均可与之对战。第一个击败此机器人的玩家则可获得Valve专设的赏金。

  我们创造了在Dota21v1比赛中能够击败世界顶尖职业选手的AI。其完全是用self-play的方式训练,没有使用模仿学习(imitation learning)或树搜索。这对构建在混乱、包含人类行为在内的复杂场景下能够完成well-defined goals的AI系统是重要一步。

  Dota1v1是含有隐藏信息的复杂游戏。代理需要学习计划、进攻、花招以及误导对手。选手技巧和手速(每分钟动作)的关联不那么强烈,实际上,我们的AI“手速”只是一般人类选手的水平。

  想要在Dota中取胜,要求选手培养出对对手的直觉,并采取相应的策略。在上述视频中,你能看到,我们的机器人已经通过完全的self-play学会了预测其他选手的动作,并在不熟悉的场景下即兴发挥,以及如何作用于选手的单位。

     投稿邮箱:jiujiukejiwang@163.com   详情访问99科技网:http://www.fun99.cn

相关推荐