AlphaStar AI程序已经成功登上《星际争霸2》三个种族的宗师段位
- EdSheeran今天(10月31日)英国AI研究机构DeepMind再次登上了《自然》杂志,并宣布旗下的AlphaStar AI程序已经成功登上《星际争霸2》三个种族的宗师(Grandmaster)段位,并且是在遵守专业批准条件的前提下实现的,也就是说AlphaStar已经成功超越了99.8%的《星际2》玩家。
据悉,AlphaStar在进行《星际争霸2》天梯比赛时使用了与正常玩家一样的规则,例如使用摄像头控制视野、正常的战争迷雾、操作水平也被限制在《星际争霸2》职业选手的水平,可以说AlphaStar能在如此限制条件下成功登上【宗师】段位非常不易。作为世界上难度水平最高的电竞游戏之一,《星际争霸2》一直是AI程序想要攻克的重大挑战。
虽然知道这个结果是迟早的问题 那接下来该玩啥? - 逆转纹章想看seraal和alphastar来场zvp
- 灼眼艾莉亚我不知道SC2是不是世界上难度水平最高的电竞游戏之一,但google的PR一定是水平最高的之一
- 斯勒恩鬼歌这APM是闲时30,打起来2000那样平均出来,还是最高只能达到250有很大区别哦。
- Limpiditydota那边不是也正在搞
如果真能研发成功倒是能解决一个难题
究竟是Ximba还是X族选手不努力,AI跑一跑看看有没有对策,有的话再看一下人类模仿的难度,就知道该不该削了 - naclken.超过99.8%的玩家不代表能和世界冠军一战啊
AI尚未突破人类极限 - 战术核辣条
- 绕指流光
- last_regret
- ccc183AI练出来了
- Chia震惊之处在于蓝色是alphastar,红色是他统计的人类
不知道怎么采的数据 - last_regret
- cmyk1234巅峰Dark、Ragnarok、SoO的在正赛的瞬时极大APM可以达到1000~1500左右。所以疑惑人类怎么能4000APM极值。
- Chia比如按1、2帧的时长统计,你一帧正好多按了几下,就上天了。
- Chia是这样的,可能外行或者就是故意这样搞数据的。主要人类的不稳定性,给他粉饰数据提供了很大空间……
比如控制反应时间那里,alphastar均值视野内113ms,视野外369ms。这也是低于职业选手水平的
但人类实际上是越紧急越慌越乱,而他算力太富余……完全在紧要关头神反应,然后在无关痛痒的时候多等一下拖平均值 - 何然
4200喷了
400线跳狗 - last_regret看过几场这个ai打欧服,极限操作说不上特别神,蟑螂对拱时还是会吃到火的,但任何时候都能及时反应,不会出什么大失误,也能打出和人类玩家完全不同的timing
—— 来自 HUAWEI JSN-AL00, Android 9上的S1Next-鹅版v2.1.2 - szqasd看了一下,三族天梯积分mmr在欧服6000左右,三线职业选手水平,跟世界冠军serral打过,被吊打。作为参考的是欧洲一线世界二线mmr要6600以上,serral本人7200
- Chia就和围棋类似,都是人类离规则本身的极限太远,然后ai靠算力压制。
实质上证明不了什么,就是把他们的算法变个花样炒出点商业价值。
辛苦sc玩家也来吃次瓜了 - last_regret这个真说不上,和之前完全靠操作跳追猎的那个版本比这个AI限制已经比较大了,不知情的看了也只会觉得是个基本功还不错的选手,和顶级职业刚正面挺吃亏的。而且星际本身的游戏特性决定了在游戏中期就不太有闲下来的时候,只是维持运营和控图就要消耗不少的apm
—— 来自 HUAWEI JSN-AL00, Android 9上的S1Next-鹅版v2.1.2 - last_regret
刚去搜了一下,这AI会被12d打死,不会农民探路,对面农民来了又走也不会去查看阴影处菌毯。看来欧服大招哥比较少没给他练出来
—— 来自 HUAWEI JSN-AL00, Android 9上的S1Next-鹅版v2.1.2 - 血狂毘沙门这种ai学习到最后都会变成类似开脚本的那种毫秒输入吧
跟挂b有区别吗 - last_regret
- 小月亮李再含到最后还不是靠操作碾压,学习能力和屎一样,dota2的时候就知道了,就靠一手无敌拉扯打团。
学了那么久,无法做到学习新英雄,不能理解眼位隐身开雾等战略性的东西。
-- 来自 能看大图的 Stage1官方 Android客户端 - Chia这个不是多大问题了。alphago最初赢欧洲选手樊麾时,也是被国内棋手不屑的。
然后一两年后,就事实登顶了。
sc项目攻略得更快,相信这个也会是不久之后的事。
就是SC值不值得再做一场秀的问题( - Chia我是觉得目前看这个项目很没意义。
比如特地把ai操作能力控制在人类的水平。
比如深度学习的训练主要通过自我对战。而限定了延时、信息获取等手段后重复RTS流程的效率也是比较低的。
这个方向有很多有价值的开放性课题,如果要在这里问一句打星际你快乐么的价值,大概也主要在赚噱头上了 - KOGmk2不,这是天马流星拳.......
- 灰色骑士这个团队需要请狗哥顾问。
- Nokazusa打这种ai多线协同就完全没用了,失去了游戏的大部分战术
- last_regretserral天梯排到过AIphastar的T,空投被完防,主力出门就被夹或者被绕狗,打起多线来肯定是不如顶级职业的
—— 来自 HUAWEI JSN-AL00, Android 9上的S1Next-鹅版v2.1.2 - 好多大象啊仔细想想,实际上这个ai就相当于多人执政官,操作协同都很强,但是感觉战术还是没办法自创,不过大部分对人战术主要都是靠多线消耗你精力,对ai也没啥用就是了。
- acalephs不限制操作能力,AI和人类玩的就不是一个游戏了,多半就像之前那样闪追=无敌
人类也没办法判断AI是不是找到了无敌操作水平下的最优解,没法评价AI学习成果 - 卢迪乌斯操作水平也被限制在《星际争霸2》职业选手的水平
这就已经直接超过90%玩家了吧 - wszweill当成regularization不就是很标准的操作,目的是规避高频操作,促使机器学习“大局观”
- 重名的mufasa我又想起那个笑话。
让AI模拟100米跑,结果AI算出来的最优解是一根100米的杆子倒下去。 - dickchou相比围棋吊打职业选手 AI打星际这结果就有点不够看了 天梯上这么多业余玩家 很多也就想起来打几盘的水准 要是哪个职业玩家说自己吊打天梯99.8%的人当自己夸耀的资本保准是会被笑话的
-- 来自 能手机投票的 Stage1官方 Android客户端 - kerorokun群星或者文明,超ai大战倒是搞起来啊
- 自賠ニャン这对比有问题吧,AI的APM百分百是有效操作,人类差远了
- kumquat_cc之前这个团队写的论文我看了一下,比起alphago/zero,这个东西的创新差太远了。
这个ai的主要思路是把握整体方向用一个ai,然后针对不同小对线团战设定很多种场景,分别训练小的agent,就相当于,一个大脑负责整体调度,另外好几个脑子负责对线微操。为了长时间场景,还用上了LSTM作为状态函数。
这个感觉更多的是经验主义,就AI上的美学来说,照alphago zero差太远了。
另外,这种能够self play的rl,应用场景在真实世界中实在有限,不然deep mind到现在还是赔钱,自动驾驶,对话系统用的rl跟这个完全不一样。
我倒是觉得deep mind可以尝试训练马里奥,去马里奥的多人对抗试一试,看看ai的闸总能到什么级别 - mrlunzer放过星际2吧,暴雪自己都玩不来了
- 奈叶的逆袭
主宰: 用P的只配跪着打比赛
- 奈叶的逆袭
AI别的不行 追猎跳的是真的厉害,目前还么有哪个P能像AI那样跳追猎。
- 奈叶的逆袭极限APM应该是 像演示的那样单体跳追猎,单体甩狗 这样搞出来的,距离感 AI第一。
- naclken.限制操作就没意思了,以后会不会发展成要限制AI每秒运算多少次啊
- 奈叶的逆袭其实也是好的,给deadgame刷次热度。双赢啊。
- chrispig不限制更没意思,3枪兵无伤戏耍地刺.gif