AlphaStar AI程序已经成功登上《星际争霸2》三个种族的宗师段位

2019-10-31 04:20

EdSheeran2019-10-31 04:20
今天（10月31日）英国AI研究机构DeepMind再次登上了《自然》杂志，并宣布旗下的AlphaStar AI程序已经成功登上《星际争霸2》三个种族的宗师（Grandmaster）段位，并且是在遵守专业批准条件的前提下实现的，也就是说AlphaStar已经成功超越了99.8%的《星际2》玩家。
据悉，AlphaStar在进行《星际争霸2》天梯比赛时使用了与正常玩家一样的规则，例如使用摄像头控制视野、正常的战争迷雾、操作水平也被限制在《星际争霸2》职业选手的水平，可以说AlphaStar能在如此限制条件下成功登上【宗师】段位非常不易。作为世界上难度水平最高的电竞游戏之一，《星际争霸2》一直是AI程序想要攻克的重大挑战。

虽然知道这个结果是迟早的问题那接下来该玩啥？
逆转纹章2019-10-31 04:24
想看seraal和alphastar来场zvp
灼眼艾莉亚2019-10-31 04:27
我不知道SC2是不是世界上难度水平最高的电竞游戏之一，但google的PR一定是水平最高的之一
斯勒恩鬼歌2019-10-31 04:29
这APM是闲时30，打起来2000那样平均出来，还是最高只能达到250有很大区别哦。
Limpidity2019-10-31 04:34
dota那边不是也正在搞

如果真能研发成功倒是能解决一个难题
究竟是Ximba还是X族选手不努力，AI跑一跑看看有没有对策，有的话再看一下人类模仿的难度，就知道该不该削了
naclken.2019-10-31 04:35
超过99.8%的玩家不代表能和世界冠军一战啊
AI尚未突破人类极限
战术核辣条2019-10-31 04:47
虫族最大apm 4k2，你还说你没开挂

—— 来自 OnePlus ONEPLUS A6000, Android 9上的S1Next-鹅版v2.1.2
绕指流光2019-10-31 04:50
4200换成人类水平大概是钻f2取火的水平了吧

—— 来自 smartisan OE106, Android 8.1.0上的S1Next-鹅版v2.1.2
last_regret2019-10-31 04:52
这极限apm是sddddddddd出来的还是秀距离感出来的差别可大了

—— 来自 HUAWEI JSN-AL00, Android 9上的S1Next-鹅版v2.1.2
ccc1832019-10-31 04:57
AI练出来了
Chia2019-10-31 04:58
震惊之处在于蓝色是alphastar，红色是他统计的人类

不知道怎么采的数据
last_regret2019-10-31 05:08
你搞个加速键盘或者改下键智能施法丢蛋刷兵的时候也挺高的，不过说不上什么极限操作

—— 来自 HUAWEI JSN-AL00, Android 9上的S1Next-鹅版v2.1.2
cmyk12342019-10-31 05:09
巅峰Dark、Ragnarok、SoO的在正赛的瞬时极大APM可以达到1000～1500左右。所以疑惑人类怎么能4000APM极值。
Chia2019-10-31 05:12
比如按1、2帧的时长统计，你一帧正好多按了几下，就上天了。
Chia2019-10-31 05:18
是这样的，可能外行或者就是故意这样搞数据的。主要人类的不稳定性，给他粉饰数据提供了很大空间……

比如控制反应时间那里，alphastar均值视野内113ms，视野外369ms。这也是低于职业选手水平的

但人类实际上是越紧急越慌越乱，而他算力太富余……完全在紧要关头神反应，然后在无关痛痒的时候多等一下拖平均值
何然2019-10-31 05:21
4200喷了
400线跳狗
last_regret2019-10-31 05:25
看过几场这个ai打欧服，极限操作说不上特别神，蟑螂对拱时还是会吃到火的，但任何时候都能及时反应，不会出什么大失误，也能打出和人类玩家完全不同的timing

—— 来自 HUAWEI JSN-AL00, Android 9上的S1Next-鹅版v2.1.2
szqasd2019-10-31 05:33
看了一下，三族天梯积分mmr在欧服6000左右，三线职业选手水平，跟世界冠军serral打过，被吊打。作为参考的是欧洲一线世界二线mmr要6600以上，serral本人7200
Chia2019-10-31 05:36
就和围棋类似，都是人类离规则本身的极限太远，然后ai靠算力压制。

实质上证明不了什么，就是把他们的算法变个花样炒出点商业价值。
辛苦sc玩家也来吃次瓜了
last_regret2019-10-31 06:22
这个真说不上，和之前完全靠操作跳追猎的那个版本比这个AI限制已经比较大了，不知情的看了也只会觉得是个基本功还不错的选手，和顶级职业刚正面挺吃亏的。而且星际本身的游戏特性决定了在游戏中期就不太有闲下来的时候，只是维持运营和控图就要消耗不少的apm

—— 来自 HUAWEI JSN-AL00, Android 9上的S1Next-鹅版v2.1.2
last_regret2019-10-31 06:45
刚去搜了一下，这AI会被12d打死，不会农民探路，对面农民来了又走也不会去查看阴影处菌毯。看来欧服大招哥比较少没给他练出来

—— 来自 HUAWEI JSN-AL00, Android 9上的S1Next-鹅版v2.1.2
血狂毘沙门2019-10-31 07:02
这种ai学习到最后都会变成类似开脚本的那种毫秒输入吧
跟挂b有区别吗
last_regret2019-10-31 07:11
apm和反应速度都做了限制的

—— 来自 HUAWEI JSN-AL00, Android 9上的S1Next-鹅版v2.1.2
小月亮李再含2019-10-31 07:38
到最后还不是靠操作碾压，学习能力和屎一样，dota2的时候就知道了，就靠一手无敌拉扯打团。
学了那么久，无法做到学习新英雄，不能理解眼位隐身开雾等战略性的东西。

-- 来自能看大图的 Stage1官方 Android客户端
Chia2019-10-31 07:51
这个不是多大问题了。alphago最初赢欧洲选手樊麾时，也是被国内棋手不屑的。
然后一两年后，就事实登顶了。

sc项目攻略得更快，相信这个也会是不久之后的事。
就是SC值不值得再做一场秀的问题（
Chia2019-10-31 08:07
我是觉得目前看这个项目很没意义。

比如特地把ai操作能力控制在人类的水平。
比如深度学习的训练主要通过自我对战。而限定了延时、信息获取等手段后重复RTS流程的效率也是比较低的。

这个方向有很多有价值的开放性课题，如果要在这里问一句打星际~~你快乐么~~的价值，大概也主要在赚噱头上了
KOGmk22019-10-31 08:22
不,这是天马流星拳.......
灰色骑士2019-10-31 10:59
这个团队需要请狗哥顾问。
Nokazusa2019-10-31 11:13
打这种ai多线协同就完全没用了，失去了游戏的大部分战术
last_regret2019-10-31 11:57
serral天梯排到过AIphastar的T，空投被完防，主力出门就被夹或者被绕狗，打起多线来肯定是不如顶级职业的

—— 来自 HUAWEI JSN-AL00, Android 9上的S1Next-鹅版v2.1.2
好多大象啊2019-11-01 12:08
仔细想想，实际上这个ai就相当于多人执政官，操作协同都很强，但是感觉战术还是没办法自创，不过大部分对人战术主要都是靠多线消耗你精力，对ai也没啥用就是了。
acalephs2019-11-01 01:02
不限制操作能力，AI和人类玩的就不是一个游戏了，多半就像之前那样闪追=无敌
人类也没办法判断AI是不是找到了无敌操作水平下的最优解，没法评价AI学习成果
卢迪乌斯2019-11-01 01:39
操作水平也被限制在《星际争霸2》职业选手的水平
这就已经直接超过90%玩家了吧
wszweill2019-11-01 02:34
当成regularization不就是很标准的操作，目的是规避高频操作，促使机器学习“大局观”
重名的mufasa2019-11-01 08:25
我又想起那个笑话。
让AI模拟100米跑，结果AI算出来的最优解是一根100米的杆子倒下去。
dickchou2019-11-01 08:42
相比围棋吊打职业选手 AI打星际这结果就有点不够看了天梯上这么多业余玩家很多也就想起来打几盘的水准要是哪个职业玩家说自己吊打天梯99.8%的人当自己夸耀的资本保准是会被笑话的

-- 来自能手机投票的 Stage1官方 Android客户端
kerorokun2019-11-01 08:53
群星或者文明，超ai大战倒是搞起来啊
自賠ニャン2019-11-01 09:00
这对比有问题吧，AI的APM百分百是有效操作，人类差远了
kumquat_cc2019-11-01 09:41
之前这个团队写的论文我看了一下，比起alphago/zero，这个东西的创新差太远了。

这个ai的主要思路是把握整体方向用一个ai，然后针对不同小对线团战设定很多种场景，分别训练小的agent，就相当于，一个大脑负责整体调度，另外好几个脑子负责对线微操。为了长时间场景，还用上了LSTM作为状态函数。

这个感觉更多的是经验主义，就AI上的美学来说，照alphago zero差太远了。

另外，这种能够self play的rl，应用场景在真实世界中实在有限，不然deep mind到现在还是赔钱，自动驾驶，对话系统用的rl跟这个完全不一样。

我倒是觉得deep mind可以尝试训练马里奥，去马里奥的多人对抗试一试，看看ai的闸总能到什么级别
mrlunzer2019-11-01 10:20
放过星际2吧，暴雪自己都玩不来了
奈叶的逆袭2019-11-01 10:36
主宰：用P的只配跪着打比赛
奈叶的逆袭2019-11-01 10:38
AI别的不行追猎跳的是真的厉害，目前还么有哪个P能像AI那样跳追猎。
奈叶的逆袭2019-11-01 10:39
极限APM应该是像演示的那样单体跳追猎，单体甩狗这样搞出来的，距离感 AI第一。
naclken.2019-11-01 10:41
限制操作就没意思了，以后会不会发展成要限制AI每秒运算多少次啊
奈叶的逆袭2019-11-01 10:41
其实也是好的，给deadgame刷次热度。双赢啊。
chrispig2019-11-01 10:43
不限制更没意思，3枪兵无伤戏耍地刺.gif