023小说网 > 玄幻魔法 > 科研系学霸 > 第159章 论文发布

第159章 论文发布(1 / 1)

就在平平无奇的某一天,《破壁论坛》创刊号,封面震撼发布。

作为aetos联盟发布的论文集,论文质量高不高暂且不谈,但是热度这块,肯定不会低,关注的人自然也不少。

纯黑的封面背景下,是一个散发着幽蓝色微光的神经网络结构图,封面正中央,写着这样一句话—apathway towardsagl—scale telligence。

使用英文只是为了方便外国人阅读,事实上,论文的原始稿件全部都是中文版本。

而ndn也被发布在了这上面,作者并不是一个人,而是整个aetos联合实验室。

很快,ndn就掀起了轩然大波,所造成的影响比当时的《attentionisall

you need》更甚。

燕京大学,智能计算实验室,凌晨三点。

不得不说,包括周昀在内的科研人员总有一个习惯,老是喜欢半夜三更发论文。

林凡,燕京大学智能计算实验室的博士后,方向是纯ai算法,平时打交道最多的就是transforr架构,他的博士论文、他正在进行的几个重点项目,无一例外,基本都是基于trans

forr架构之上。

桌边,一杯冷掉的咖啡旁,散落着几篇试图在transforr基础上做一些轻微改进的论文草稿。

就在他揉着发胀的太阳穴,准备再次编译代码时,一个偶然弹出的学术社区推送吸引了他的目光——《破壁论坛》?

怎么感觉好象在哪里听到过这个名字?

但是具体的他也想不起来了,嘟囔了几句,顺手点开了推送,毕竟科研也得劳逸结合,放松放松脑子,说不定会有新的思路。

“apathwaytowardsagl—scale telligence?”他轻声念出副标题,嘴角下意识地撇了撇,“又一个标题党。”

毕竟agi这个词,在学术界都快被用滥了,在最近几年,新出现的架构其实并不算少,而且每一个都号称超越了transforr,结果经过试验之后,很大一部分都是徒有其表,唯一一个还有点看头的就是aba架构,但也称不上颠复transforr。

不过他还是决定看一看,他点开了pdf。

“aetos联合实验室?原来是这个实验室!”作为国内热度一直不小的aetos

联盟,现在在整个计算机圈子里,基本就没有不认识的了,他们实验室有的项目还是用的aetos提供的方案做的,当他看到作者名字的时候,下意识提起了几分兴趣。

目光扫过摘要,看到“动态神经元”、“自发功能集群”、“摒弃固定层级”这些字眼时,眉头微微皱起。

引言部分匆匆扫了一眼,基本还是那些,他几乎都能背的出来,无非就是现有的各种架构的缺陷,这已经是一种写作套路了。

接下来的方法部分才是重头戏。

十分钟后,他的眼神逐渐专注,半小时后,他冲好了第二杯咖啡,但一口没喝,眼睛死死盯着屏幕上的数学推导和架构图,一小时后,他咬着笔尖,思考着论文中的数学公式。

笔尖在草稿纸上无意识地划拉着,在他的认知里,神经元就是加权求和、激活函数,是确定性的、可微的、为了反向传播而存在的组件,而ndn描述的却完全不是这样。

他本能地想否定,但那些用精确的数学语言定义了“动态神经元”的内部状态空间、模式选择函数以及参数微调机制告诉他,就是这样的!

他尝试沿着作者的思路进行推导,惊愕地发现,这套看似离经叛道的框架,在数学逻辑上竟然是自洽的!甚至————有一种异样的美感?

“这不可能————”他喃喃自语,这篇论文里的理论完全颠复了他对神经网络底层运作方式的认知!

但是根据论文的逻辑,这些看似颠复常识的方法却又符合数学逻辑。

而且当他看到实验部分,一条条碾压基准线、甚至呈现几何级数差距的曲线映入眼帘时,他只有一个感觉—要变天了!

数据不会说谎,除非他学术造假,但是这样一个大型实验室,完全没必要吧?

“难道我们一直走在一条次要的路径上?”

对于把大多数精力都放在transforr架构身上的他来说,打击无疑是巨大的o

他在椅子上,目光失焦地望着屏幕,过去几年里,他熬夜推导的公式、调试的模型、撰写的论文,那些曾经让他充满成就感的成果,此刻在ndn面前,仿佛都是无用功。

就好象你修炼了一百年,终于要飞升的时候,有人告诉你,你修炼错了,你这样是飞升不了的,而他还没什么理由反驳。

简单来说,他有点道心破碎了。

不过,并不只有他一个人有这种感觉,几乎全球所有的学者,都是差不多的感觉。

麻省理工学院,某顶尖ai实验室。

一位刚刚凭借transforr架构改进获得顶会最佳论文奖的博士生,正志得意满地准备将成果开源,他顺手点开了导师转发来的ndn论文链接。

半小时后,他脸上的笑容彻底消失,取而代之的是一种茫然,他环顾实验室里挂满的白板,上面密密麻麻都是注意力机制的变体和优化公式,曾经这些都是他的骄傲,但是现在,似乎变的没什么意义了。

硅谷,某研究院。

一场原定讨论下一代千亿参数模型架构的早间会议,彻底跑题,巨大的投影屏上展示着ndn的性能曲线图,会议室里鸦雀无声。

一位资深首席科学家猛地将手中的激光笔摔在桌上,发出“啪”的一声脆响,打破了沉默。

欧洲,某大学城的咖啡馆。

一位年轻的助理教授和他的博士生相对而坐,笔记本屏幕上同样是那篇论文,博士生声音颤斗:“教授,我明年就要毕业了,我的毕业论文全是基于transforr的扩展————”

助理教授苦笑着摇了摇头,拍了拍学生的肩膀,想说些安慰的话,却发现自己词穷,他自己的tenure(终身教职)申请材料里,transforr相关的工作也是重中之重,但是现在,随着ndn的提出,恐怕都要作为无用功了。

从顶尖学府到工业界巨头,从功成名就的学者到踌躇满志的青年研究员,同样的迷茫开始在全球ai圈蔓延。

对他们来说,ndn的提出,无异于是天塌了。

好消息:研究有进展。

坏消息:方向重了。

但是技术的进步,总归还是好事,毕竟并不是所有计算机专业的相关研究者都是死抠transforr架构,大多数人还只是把他当成一个工具而已,既然有更好用的工具提出来,那他们换掉就是。

仅仅是论文发布的当天晚上,就有研究团队宣布复现成功了,毕竟论文里有几个轻量级的验证模型,跑起来不费多少时间。

除了这些学术研究者,要说反应最大的,不是联盟的几个大厂,反倒是那些选择了梭哈的小厂。

国内某小厂的办公室。

“钱总!钱总!爆了!彻底爆了!”

年轻的助理几乎是撞开了钱总办公室的门,举着平板计算机的手都有些颤斗,脸上涨的通红。

钱总正对着一份日常运营报表有些走神,最近一段时间,他表面镇定,实则内心承受着巨大的压力,他抬起头,刚想训斥下属的冒失,目光却落在了助理递过来的平板屏幕上。

是最新的新闻,硕大的标题异常醒目:

【ndn架构横空出世,aetos生态概念股全线飙红!】

钱总伸向平板的手,在空中停顿了一瞬,他接过平板,手指滑动,又看到了科技版块的头条:

【颠复性突破!aetos联合实验室发布ndn架构,agi路径壑然开朗!】

【多家国际顶尖实验室宣布初步复现ndn轻量模型,性能与论文宣称一致!】

一条条标题,看的他眼睛越来越亮。

随后,他缓缓地靠在了他那张有些旧了的办公椅背上,抬起手,用力抹了一把脸,手指在眼框周围停留了片刻。

一旁的小助理看情况有些不对,悄咪咪地退出了房间,顺便还把门带上了。

过了足足有一分钟,钱总才长长地舒出了一口气,他再睁开眼时,眼圈有些发红。

“赌对了!”

不过作为商人,他的嗅觉是绝对伶敏的,很快就看到了其中的巨大商机。

他迅速按下了内部通信键,“通知所有部门负责人,大会议室紧急会议!!!”

十分钟后,原本略显空旷的会议室被挤得满满当当。

钱总没有废话,指着投影幕布的ndn论文封面,开门见山:“这个东西也许有人不熟悉,没关系,我也不熟,但是我知道,凭借这东西,日后aetos的生态绝对爆火,因为ndn就是基于aetos生态的,这就意味着一个足以和cuda分庭抗礼,甚至在未来碾压它的新计算生态,正在我们脚下破土而出!

而我们就是现在是这个生态里,最早入局、押注最重的玩家之一!想必大家都知道这代表什么。”

画饼这个技能,作为公司老板,他可以说是非常熟练。

“这是千载难逢的机会!是我们这种小厂商,能够再进一步的唯一机会!所以,从今天起,公司所有战略,全部转向aetos生态!

咱们所有的计算卡,都要对aetos做适配!所有研发人员,分成三班倒,吃透ndn论文,尽快将ndn落地应用。”

星海”的能力他见过,这样一个大模型,无论放在什么领域都不愁赚不到钱,时间才是唯一的阻碍。

虽然他们公司小,但是该有的部门一个不少,很快在钱总的命令下快速运转起来。

消息出来之后,作为现在aetos联盟最大的对手英伟达肯定也有所反应。

英伟达总部会议室里。

气氛凝重得能拧出水来,投影上,正清淅地展示着《破壁论坛》的论文封面,以及性能对比图表。

老黄坐在主位上,他已经不记得这是今年第几次因为aetos开会了。

之前ad新驱动的事情,在他看来其实也就是小打小闹,毕竟消费级显卡并不是他们最为主要的赚钱领域,但是现在不一样了,atos联盟提出的ndn已经侵犯了他们最为内核的领域—ai。

老黄看着投影,操作了一下面前的控制器,调出了一张复杂的图表,上面清淅地标注着英伟达近年来在ai芯片研发上的投入轨迹,以及基于传统scalg

w对未来性能提升的预测。

“看看这个,”他的手指重重地点在预测曲线上,“我们投入数百亿美金,数千名顶尖工程师,按照这个路线图,预计在下个季度才能将特定模型的性能再提升可怜的百分之几十,而他们————”

他的手指划向ndn那几乎垂直的性能曲线,“用一套全新的架构,直接在能效和性能上实现了数量级的跨越!”

“先生们,这是生存危机,如果ndn被证明是更优的路径,那么我们庞大的gpu库存、我们规划的下一代芯片、我们赖以生存的cuda生态————所有这些,价值都可能在一夜之间蒸发大半!”

这一点他丝毫没有在危言耸听,虽然n卡的存世量巨大,但是全球对于他们的不满早就是写在脸上了,毕竟没有什么人愿意给一个拢断商好脸色,这就意味着,一旦出了问题,他们将面临的,一定是群起而攻之的场面。

“没错,而且最致命的是能效比,ndn论文里提到的能耗降低超过60,在大型数据中心运营中,这意味着天文数字的成本优势,我们的客户,那些云服务巨头,会毫不尤豫地转向能给他们省下数十亿电费的技术。”

“我们需要时间!”软件研究部门的负责人忍不住说道,“我们需要时间去理解、复现、找到应对甚至超越ndn的方法!”

“时间?”老黄冷笑一声,“资本市场会给我们时间吗?我们的客户会给我们时间吗?那些嗅觉敏锐的开发者会给我们时间吗?

他没有说下去,但所有人都明白。

“我不管你们用什么方法!”老黄站起身“动用一切资源!收购任何有潜力的相关初创公司!挖角他们的内核研究人员!

我要在三个月内,看到我们自己的下一代动态神经拟态架构”!同时,软件部门必须立刻开始研究cuda向此类架构的迁移工具!”

“如果我们做不到————”他停顿了一下,“那么坐在这个房间里的我们,都将是英伟达帝国崩塌的见证者和责任人。

,,

章节报错(免登录)
最新小说: 火影:开局一座城死的活的都来了 重生火红年代,我有百亩空间 我!概念神!镇压万古奇迹! 老师卡卡西,超时空同居野原琳 不为李达康背锅我成了汉东保护神 抗日之铁血八路 重生之元主 【综】和机器人谈恋爱 史上最强炼气期(又名:炼气五千年) 大佬已退圈