随着游戏进入对抗阶段,罗晟期待满满的观看娜芙的第一视角,看看表现如何。
这场对抗是[人族vs虫族],人类对手是一名虫族玩家,而娜芙选择的则是人族。
游戏刚刚开局,观看娜芙第一视角的罗晟就感觉巨尴尬,因为“她”控制着四个农民在地图晃悠了一圈,然后才回头去采矿,持续时间大约半分钟左右。
得,开局就大劣。
这还打泥煤,真是个人工智障。
这一幕直接把罗晟看醉了。
不明白的还以为“她”对这个世界充满了好奇呢,果然是个人工智障。
随后,娜芙连续造了两个房子,罗晟本以为“她”会把兵营建筑放下去,然而“她”并没有建造兵营。
而是存了一笔钱去开二矿去了……
观看第一视角的罗晟突然觉得,娜芙现在的这些行为操作,就是个纯新人第一次接触星际争霸这款游戏一样,没有任何区别。
随着时间一分一秒的流逝,与之对抗的虫族玩家前来侦察,看到对手的开局。
虫族玩家也看傻了。
什么鬼?
这是什么打法?
于是爆了一波小狗过来,这个时候娜芙才刚刚造第一个机枪兵,还没出来。
随着对手一波侦察部队试探性进攻的小狗进入矿区,娜芙抵抗了一会无力回天,最终打出gg结束了比赛。
第一场对抗被对方一小股侦察部队给打死了。
其实对面的人类玩家实力并不高,只是一名普通玩家而已,想要遇到真正的顶级职业玩家,娜芙需要在天梯中不断的对抗,战胜一个个人类对手,每一次胜利都会匹配到更强的对手,直到登上金字塔顶端与真正的顶级职业玩家对抗。
当然了,以罗晟的技术完全可以强行修改匹配系统的算法,让娜芙直接匹配到顶尖玩家,不过他没有那么做。
目前,星际争霸这款游戏是时下爆火的电竞游戏,玩的人超级多,尤其是韩国那边。
甚至有个夸张的说法,眼下在韩国,1040岁的男子如果说他不会打星际会被疯狂嘲讽。
……
很快,第二局对抗开始了,这一次是tvt对抗局,即[人族vs人族]。
到了第二局对抗,娜芙有了明显的进步,这一局对抗虽然同样输了,但至少把兵推到了对手的家里。
一波主力全送掉之后,被对方机械化战术反推回来。
再次打出gg。
下一把快速重开。
……
当到了第五局对抗,又是tvz,也即是[人族vs虫族]。
接连输掉比赛的娜芙,终于展现了“她”非同凡响的一面,其强大的学习能力让“她”适应了这个水平的“tvz”对抗,并且轻松的以操作碾压战胜了对手。
这一场对抗娜芙虽然以堪比顶级职业选手的操作水平把对手打败,但其中一个细节就是“她”从来不会在相同的地方犯第二次错误。
换个说法就是,娜芙的学习进步速度太恐怖了,每一次对抗对“她”来说都是学习。
罗晟通过这五场与人类玩家对抗的比赛中也看到了娜芙暴露出来的一个缺陷,就是除了特定的分兵战术,“她”并不能形成灵活的兵力分配。
在输掉的第四局对抗中,一名高水平的人类玩家对娜芙的基地不停的多线骚扰,而“她”一旦回防对方就立刻跑路,等“她”的兵出门展开进攻的时候又转回来继续骚扰。
这场对抗,面对人类玩家的灵活出兵策略,娜芙只能被动应战,无法形成对人类玩家的有效进攻,也导致了最后滚雪球效应起来了。
最终落败。
第五局对抗结束之后,罗晟让娜芙停止了匹配对手,然后对其重新进行了一次大幅的升级优化。
他觉得这样的学习效率仍然显得太慢。
娜芙的智能体采用的是深度学习算法,罗晟对其进行了一次精心升级之后,包括了神经网络、通过强化学习的自我对弈,多智能体学习、模仿学习等算法或技术。
其中所谓的自我对弈,简单说就是自我学习,通过不断的试错找到让自己胜率最大的游戏方式。
而通过自我对弈和强化学习,构成了开放端学习算法的基本范式,学习人的策略,并确保娜芙的智能体在整个游戏过程中不断探索这些策略,从而让“她”获得更大的升级与进步。
此外,由于星际争霸这款游戏具有巨大的动作空间,会让许多先前强化学习方法变得无效。
罗晟因此还为娜芙开发了一种全新的算法进行非策略强化学习,使得“她”能从旧有的历史决策的游戏中有效的更新决策。
而罗晟的终极目的可不是让娜芙成为一个“iba”的星际争霸ai玩家,而是以此为,让“她”能够胜任复杂多变的其它应用场景。
如果“她”只是在星际争霸的比赛中成为超级高手,换个场景,例如在围棋、语言或其它领域就不行了,那依然是个纯粹的人工智障,和真正的人工智能有着巨大的差距。
……
时间一分一秒的流逝,罗晟猫在他的办公室不知不觉就耗费了三个多小时,为娜芙完成了第二次的优化升级才下班,时间已经不早了。
罗晟在离开办公室之前,又把娜芙放进了暴雪星际战网的天梯中,让“她”与人类玩家不停的对抗。
搞定这一切就没有在管了,下午还要去蔚蓝海岸公司处理一些工作,还有一场会议什么。
而被放养的娜芙就在做一件事情,不断与人类玩家对战。
娜芙的背后支撑“她”的几乎是整个苏城数据中心,消耗的是算力资源,是电费。
事实上如果没有钱,是不可能养得起一个人工智能的,就更别说是开发阶段了。
如果是像ib公司这样的人工智能研发机构,制约其发展的可能是开发者本身,但见证过人工智能的罗晟,对于开发而言反而是最轻松的。
但仍然有问题制约着他。
那就是硬件,娜芙的成长被现在的硬件水平限制了,如果有更好的硬件基础,会迎来一次质的飞跃。
深度网络需要高端gu在大量数据的合理时间内进行训练,这些硬件非常昂贵,当然在罗晟这里没有贵这个说法。
可问题是现在没有符合他要求的硬件,有钱都没得买,今后只能自己起炉灶搞硬件了,
如果没有先进硬件基础来训练深层网络以实现高性能是不可行的。
不仅仅要使用高端gu,还需要快速的cu、存储以及快速和超大容量的ra。
……
随着时间的推移,娜芙通过不断的对战,胜率从“她”赛事生涯第一局开始的惨不忍睹,逐渐出现了反转,胜率正在快速的提高。
在操作层面,娜芙毫无疑问是世界第一,没有人类玩家能够在这个层面与“她”抗衡,哪怕是被限制了a和e。
但这不是重点,重点是娜芙在游戏中所表现出来的“意识”、“行为”与“决策”,这是才是智能化的体现。
……
不知不觉,娜芙已经在天梯上对抗了27场,胜率已经攀升到了70左右,这是非常高的胜率了。
罗晟为了提高娜芙“进化”的效率,让“她”在对战的同时,进入了蓝星科技集团的海量数据库以及星际争霸的一些网站去访问一些顶尖选手的“战报”视频,通过对人类玩家的游戏回放视频并行训练,然后与其他对手对抗训练。
后台运行中的一个脚本会让“她”每隔一段时间就迭代升级,通过强化学习进行更新,然后再进行新的对抗。
而每次迭代就匹配新的对手,同时冻结原来打败过的对手,匹配对手的概率决定了智能体采用的学习目标函数,如此一来保留了多样性的同时增加难度。
随着自我博弈的进行,娜芙逐渐开发出了越来越成熟的战术,或者说相对最优解,这一过程和人类玩家发现战术的过程类似,新的战术体系不断击败旧的战术体系,然后取代旧的战术体系。
……
到了第32局对抗,如同攀登天梯一样,娜芙不断的击败对手,不断的自我迭代,变得越来越强,碰到的人类玩家也越来越强,但90都已经成为了“她”的手下败将。
此时此刻,又一轮对抗开始了,而娜芙匹配到的选手已经达到了职业玩家的对抗水平了。
所有被“她”击败的人类玩家都不知道他们的对手今天才开始接触这个游戏,更不知道他们的对手不是人类,而是一个ai。
这一局对抗是[人族vs虫族],双方的id分别是[nov]与[yjf91]。
对战一开始,两边正常开局运营和侦察,id叫[yjf91]的这名人类玩家正位于杭城的某间屋子里,他已经离开了“意境”这支战队。
但现在还保留这个id,而他现在是一名真正的星际职业选手,在国内星际界是一流顶尖高手,江湖人送外号“江南狗王”,作为一名虫族玩家,其小作在游戏开局前五分钟号称世界级。
五分钟后就……
好吧,要是f91跑到韩国去,他的实力在那边就是个洗碗的,蹲饮水机的都能吊打他,随便拉出一个韩国的星际职业选手都可能把他吊起来打。
“nov……??卧烤这个id是谁的马甲啊?操作不错,有点实力啊。”此时这局对抗已经进入到了中期阶段,f91并没有如上一把一样轻取对手拿下这场比赛,相反打的颇为艰难,甚至已经明显感受到了对手带给他的压力。
关键是他现在非常疑惑,这个id他从来没有见过,国内星际圈能有这份实力的玩家,基本上是牌面了,那也基本都认识了。
可nov这个id是第一次见到,而且打法风格也是第一次见过,这也直接让f91逐一排除了他熟悉的那些国内的星际高手。
“不管了,哪路神仙来了,碰到了哥,都得死。”f91心中默念着,然后他的主力部队就开始出门,准备发起进攻。
[鸡地遭受攻击!]
但就在他的主力刚刚出门没一会儿,耳机的声音就疯狂提示基地遭受攻击,f91下意识切屏到自家主矿,然后看到了一个让他无比震惊的画面。
“卧烤,卧烤,什么东西啊?这什么东西啊?麻辣个臀这操作……卧烤!!”
原来,就在f91准备发起进攻的同时,娜芙已经派出了五船兵也发起了攻击,而且还特意向地图六点钟的位置绕了一下,以躲避地图中间对手布下的视野,并且多次用雷达提前做好反侦察,确保自己的空投部队不被对方发现。
如果罗晟看到了一定会很满意,这个对于人类玩家来说看似再寻常不过的决策,但如果是一个ai在执行可就不一样了。
这个进步,不可谓不大。
值得一提的娜芙虽然是ai,但“她”并没有“开图”,同样有战争迷雾,而且操作也需要向人类玩家一样切屏,在这些参数确保做到与人类玩家一样,不然就是欺负人了。
f91的部队刚刚出门,而娜芙的五船兵随后顺利抵达对手的主矿高地。
然后,f91看到了让他无比震惊的操作画面。
对手的五艘运输机居然一边飞行一边空投部队,使得作战部队像地毯一样平铺在地图上,从而做到在最短的时间内施展出了最大的火力输出。
这一波空投直接打崩了f91的主矿,不过片刻,另一波三船兵的地毯式空投将f91的分矿基地和留守的少量部队悉数摧毁。
眼看着家里两开花,主力部队已经推进过半,这个时候回援已经毫无意义,肯定必输。
所以f91决定拼一枪。
跟对手换家!
主力部队不回援,只有这样还可能有胜算。
于是,虫族部队不管家里开花的局面,浩浩荡荡的冲向人族所在矿区。
“建筑学做的有点好啊……”
f91的部队推到对手的分矿,中途被一些建筑卡的有点难受,但没过片刻就再度惊呼“麻辣个臀的这什么东西啊?这这……他家里怎么可能还有这么多部队?暴兵如尿崩?”
震惊的f91费劲九牛二虎之力也没能换掉对手的这片分矿,而主力部队已经损失了三分之二,家里又已经两开花。
已然无力回天,把最后剩下的所有部队a了上去送光,给自己打出gg的理由。
退出来之后,f91没有进行排位,他立刻就点开录像回看游戏,从开局到最后结束,看完了对手的整段第一视角回放,对方的运营、暴兵、攀科技和进攻包括防守等等。
这个从来没有见过的id,其所展现出来的运营和操作让他无比震撼,这绝对是韩国顶级高手才有的水平。
尤其是对方进攻时的地毯式空投部队,看到那一幕的瞬间,让他感觉这个id就是星际“人皇”boxer在操作,地毯式空投就是他开创的极限操作。
其实f91知道怎么操作地毯式空投,但是他根本就操作不过来,这是硬伤。
刚刚对手那5船兵的地毯式空投,其操作流程需要分别将每个运输机逐一编号,然后在降落部队的时候需要左手依次切换编队,同时右手操作鼠标点击运输机里面的兵,多次循环操作直到完成全部的空投。
说起来简单,实际上极其困难,普通玩家根本不可能做到,而要完成这样的操作,意味着需要在三秒左右的时间里实现40次的鼠标键盘精准而连贯的左右手协同操作,期间不能出现顺序错误。
如果仅仅只是做到这些,那星际争霸就不会这么难玩了,在做到这些的同时还得运营家里。
此时此刻,f91满脑子都是问号国内什么时候出现操作这么流弊的星际玩家了?
这操作水准绝对达到了世界顶尖水平,包括流畅的运营和恐怖的暴兵能力,如果不是亲自打出gg,亲自在对抗,亲自看了录像,f91绝对不会相信这是国内的玩家,绝对会相信这就是某个韩国顶级高手的马甲。
震撼过后,他继续排位。
希望能够再碰一次,即便是被虐菜也很乐意,对于职业选手来说,和强于自己的高手对抗,哪怕被对方吊打也非常乐意,因为自己也能进步。
不过接下来他已经排不到了,凡是被娜芙击败的人类玩家不会再排到第二把。
娜芙在国内登顶之后,“她”就会进入韩国的战网,和真正的世界顶尖星际职业玩家对抗。
在这短短的一天时间之内,罗晟并不知道这个id在国内星际突然圈火了。
各路成为“受害者”的大神玩家开始在社群论坛发帖询问这个突然蹦出来的nov到底是哪路神仙,居然把各路高手挨个的爆锤了个遍。
手都没还就gg了。
而“受害者”也都汇聚一堂纷纷相互“诉苦”自己是如何被打爆的,同时,与娜芙对战的一些录像也都纷纷上传到了蓝星视频,越来越多慕名而来的星际玩家观看视频。
叫“nov”的这个id几乎在一夜之间就于国内星际圈内火了。
圈内的话题都围绕在这个神秘而强大的人族玩家进行讨论,也都在想方设法的试图找到这个id的真人。
……