AlphaStar AI程序已经成功登上《星际争霸2》三个种族的宗师段位

  • E
    EdSheeran
    今天(10月31日)英国AI研究机构DeepMind再次登上了《自然》杂志,并宣布旗下的AlphaStar AI程序已经成功登上《星际争霸2》三个种族的宗师(Grandmaster)段位,并且是在遵守专业批准条件的前提下实现的,也就是说AlphaStar已经成功超越了99.8%的《星际2》玩家。
    据悉,AlphaStar在进行《星际争霸2》天梯比赛时使用了与正常玩家一样的规则,例如使用摄像头控制视野、正常的战争迷雾、操作水平也被限制在《星际争霸2》职业选手的水平,可以说AlphaStar能在如此限制条件下成功登上【宗师】段位非常不易。作为世界上难度水平最高的电竞游戏之一,《星际争霸2》一直是AI程序想要攻克的重大挑战。



    虽然知道这个结果是迟早的问题 那接下来该玩啥?
  • 逆转纹章
    想看seraal和alphastar来场zvp
  • 灼眼艾莉亚
    我不知道SC2是不是世界上难度水平最高的电竞游戏之一,但google的PR一定是水平最高的之一
  • 斯勒恩鬼歌
    这APM是闲时30,打起来2000那样平均出来,还是最高只能达到250有很大区别哦。
  • L
    Limpidity
    dota那边不是也正在搞

    如果真能研发成功倒是能解决一个难题
    究竟是Ximba还是X族选手不努力,AI跑一跑看看有没有对策,有的话再看一下人类模仿的难度,就知道该不该削了
  • n
    naclken.
    超过99.8%的玩家不代表能和世界冠军一战啊
    AI尚未突破人类极限
  • 战术核辣条
    虫族最大apm 4k2,你还说你没开挂

    —— 来自 OnePlus ONEPLUS A6000, Android 9上的S1Next-鹅版v2.1.2
  • 绕指流光
    4200换成人类水平大概是钻f2取火的水平了吧

    —— 来自 smartisan OE106, Android 8.1.0上的S1Next-鹅版v2.1.2
  • l
    last_regret
    这极限apm是sddddddddd出来的还是秀距离感出来的差别可大了

    —— 来自 HUAWEI JSN-AL00, Android 9上的S1Next-鹅版v2.1.2
  • c
    ccc183
    AI练出来了
  • C
    Chia
    震惊之处在于蓝色是alphastar,红色是他统计的人类

    不知道怎么采的数据
  • l
    last_regret
    你搞个加速键盘或者改下键智能施法丢蛋刷兵的时候也挺高的,不过说不上什么极限操作


    —— 来自 HUAWEI JSN-AL00, Android 9上的S1Next-鹅版v2.1.2
  • c
    cmyk1234
    巅峰Dark、Ragnarok、SoO的在正赛的瞬时极大APM可以达到1000~1500左右。所以疑惑人类怎么能4000APM极值。
  • C
    Chia
    比如按1、2帧的时长统计,你一帧正好多按了几下,就上天了。
  • C
    Chia
    是这样的,可能外行或者就是故意这样搞数据的。主要人类的不稳定性,给他粉饰数据提供了很大空间……


    比如控制反应时间那里,alphastar均值视野内113ms,视野外369ms。这也是低于职业选手水平的

    但人类实际上是越紧急越慌越乱,而他算力太富余……完全在紧要关头神反应,然后在无关痛痒的时候多等一下拖平均值
  • 何然
    4200喷了
    400线跳狗
  • l
    last_regret
    看过几场这个ai打欧服,极限操作说不上特别神,蟑螂对拱时还是会吃到火的,但任何时候都能及时反应,不会出什么大失误,也能打出和人类玩家完全不同的timing

    —— 来自 HUAWEI JSN-AL00, Android 9上的S1Next-鹅版v2.1.2
  • s
    szqasd
    看了一下,三族天梯积分mmr在欧服6000左右,三线职业选手水平,跟世界冠军serral打过,被吊打。作为参考的是欧洲一线世界二线mmr要6600以上,serral本人7200
  • C
    Chia
    就和围棋类似,都是人类离规则本身的极限太远,然后ai靠算力压制。

    实质上证明不了什么,就是把他们的算法变个花样炒出点商业价值。
    辛苦sc玩家也来吃次瓜了
  • l
    last_regret
    这个真说不上,和之前完全靠操作跳追猎的那个版本比这个AI限制已经比较大了,不知情的看了也只会觉得是个基本功还不错的选手,和顶级职业刚正面挺吃亏的。而且星际本身的游戏特性决定了在游戏中期就不太有闲下来的时候,只是维持运营和控图就要消耗不少的apm

    —— 来自 HUAWEI JSN-AL00, Android 9上的S1Next-鹅版v2.1.2
  • l
    last_regret
    刚去搜了一下,这AI会被12d打死,不会农民探路,对面农民来了又走也不会去查看阴影处菌毯。看来欧服大招哥比较少没给他练出来

    —— 来自 HUAWEI JSN-AL00, Android 9上的S1Next-鹅版v2.1.2
  • 血狂毘沙门
    这种ai学习到最后都会变成类似开脚本的那种毫秒输入吧
    跟挂b有区别吗
  • l
    last_regret
    apm和反应速度都做了限制的

    —— 来自 HUAWEI JSN-AL00, Android 9上的S1Next-鹅版v2.1.2
  • 小月亮李再含
    到最后还不是靠操作碾压,学习能力和屎一样,dota2的时候就知道了,就靠一手无敌拉扯打团。
    学了那么久,无法做到学习新英雄,不能理解眼位隐身开雾等战略性的东西。

    -- 来自 能看大图的 Stage1官方 Android客户端
  • C
    Chia
    这个不是多大问题了。alphago最初赢欧洲选手樊麾时,也是被国内棋手不屑的。
    然后一两年后,就事实登顶了。

    sc项目攻略得更快,相信这个也会是不久之后的事。
    就是SC值不值得再做一场秀的问题(
  • C
    Chia
    我是觉得目前看这个项目很没意义。

    比如特地把ai操作能力控制在人类的水平。
    比如深度学习的训练主要通过自我对战。而限定了延时、信息获取等手段后重复RTS流程的效率也是比较低的。

    这个方向有很多有价值的开放性课题,如果要在这里问一句打星际你快乐么的价值,大概也主要在赚噱头上了
  • K
    KOGmk2
    不,这是天马流星拳.......
  • 灰色骑士
    这个团队需要请狗哥顾问。
  • N
    Nokazusa
    打这种ai多线协同就完全没用了,失去了游戏的大部分战术
  • l
    last_regret
    serral天梯排到过AIphastar的T,空投被完防,主力出门就被夹或者被绕狗,打起多线来肯定是不如顶级职业的

    —— 来自 HUAWEI JSN-AL00, Android 9上的S1Next-鹅版v2.1.2
  • 好多大象啊
    仔细想想,实际上这个ai就相当于多人执政官,操作协同都很强,但是感觉战术还是没办法自创,不过大部分对人战术主要都是靠多线消耗你精力,对ai也没啥用就是了。
  • a
    acalephs
    不限制操作能力,AI和人类玩的就不是一个游戏了,多半就像之前那样闪追=无敌
    人类也没办法判断AI是不是找到了无敌操作水平下的最优解,没法评价AI学习成果
  • 卢迪乌斯
    操作水平也被限制在《星际争霸2》职业选手的水平
    这就已经直接超过90%玩家了吧
  • w
    wszweill
    当成regularization不就是很标准的操作,目的是规避高频操作,促使机器学习“大局观”
  • 重名的mufasa
    我又想起那个笑话。
    让AI模拟100米跑,结果AI算出来的最优解是一根100米的杆子倒下去。
  • d
    dickchou
    相比围棋吊打职业选手 AI打星际这结果就有点不够看了 天梯上这么多业余玩家 很多也就想起来打几盘的水准 要是哪个职业玩家说自己吊打天梯99.8%的人当自己夸耀的资本保准是会被笑话的

    -- 来自 能手机投票的 Stage1官方 Android客户端
  • k
    kerorokun
    群星或者文明,超ai大战倒是搞起来啊
  • 自賠ニャン
    这对比有问题吧,AI的APM百分百是有效操作,人类差远了
  • k
    kumquat_cc
    之前这个团队写的论文我看了一下,比起alphago/zero,这个东西的创新差太远了。

    这个ai的主要思路是把握整体方向用一个ai,然后针对不同小对线团战设定很多种场景,分别训练小的agent,就相当于,一个大脑负责整体调度,另外好几个脑子负责对线微操。为了长时间场景,还用上了LSTM作为状态函数。

    这个感觉更多的是经验主义,就AI上的美学来说,照alphago zero差太远了。

    另外,这种能够self play的rl,应用场景在真实世界中实在有限,不然deep mind到现在还是赔钱,自动驾驶,对话系统用的rl跟这个完全不一样。

    我倒是觉得deep mind可以尝试训练马里奥,去马里奥的多人对抗试一试,看看ai的闸总能到什么级别
  • m
    mrlunzer
    放过星际2吧,暴雪自己都玩不来了
  • 奈叶的逆袭
    主宰: 用P的只配跪着打比赛
  • 奈叶的逆袭
    AI别的不行 追猎跳的是真的厉害,目前还么有哪个P能像AI那样跳追猎。
  • 奈叶的逆袭
    极限APM应该是 像演示的那样单体跳追猎,单体甩狗 这样搞出来的,距离感 AI第一。
  • n
    naclken.
    限制操作就没意思了,以后会不会发展成要限制AI每秒运算多少次啊
  • 奈叶的逆袭
    其实也是好的,给deadgame刷次热度。双赢啊。
  • c
    chrispig
    不限制更没意思,3枪兵无伤戏耍地刺.gif