会议大厅,罗靖环视众人道:“比如一个问题是对一个小孩解释什么是登入火星,给的回答是一些人去了火星。然后把这些对话内容作为一个数据集,让灵境gpt进行学习,但光是上课不能毕业,想要毕业就得做题、考试。”
罗靖环视众人笑道:“其实就是一个反馈机制,所以我们接下来的任务是要给灵境gpt加上来自人类反馈的强化学习,也就相当于是参加考试。回答错误,重修;回答正确,进一步学习,直到灵境gpt通过考试拿到足够的学分来证明自己的能力。”
回头瞄了眼会议大屏幕并且按了下小遥控器,罗靖条理清晰地说:“具体怎么做呢?还是刚刚的问题举例,给一个小孩解释什么叫登陆火星,让微调过的也就是上完课程的灵境gpt来回答,会生成四個答案,a解释重力、b解释战争、c解释火星是一个天体、d人类去了火星。”
说到这里,罗靖顿了片刻继续说道:“然后就是根据真实、无害、有帮助等若干维度来给这些答案排序、评分,排序结构就是d>c>b=a,之后就是将这些问题和答案以及答案的排序,将这些数据集拿来训练一个奖励模型,训练的目标是让建立模型的评分标准接近人工排序标准。”
“相当于是训练一个ai老师,之后就是最后一步了,通过强化学习来继续训练微调后的灵境gpt,把生成的答案拿去给前面训练好的奖励模型进行打分,根据打分来调整,最终就是灵境gpt生成的答案获得的分数越高越好,一个语言大模型就诞生了。”
罗靖环视在场的工程师们:“随着持续的学习、不断的数据投喂,用海量的数据对灵境gpt进行训练,直到突破某个临界值节点的那一刻,它将表现的越来越像人,以至于一个普通人隔着屏幕跟它聊天的时候甚至都无法察觉对方是个ai。”
接下来,罗靖继续讲述这个语言模型的内核,在场的工程师们直呼开眼,这要是成功了简直不得了。
这就是t10级大神么?
末了,罗靖突然话锋一转,旋即说道:“但灵境gpt的大模型以此开发,还是有它自身的局限性,而且这种局限性是先天注定的。”
与会的工程师们一言不发,一个个都认真的听着,大部分人还在做笔要纪录。
罗靖说道:“要让灵境gpt能够‘读懂’人类的语言是基于统计学规律靠死记硬背,那就意味着它没有接触过的知识是不知道的,比方说投喂给灵境gpt的历史数据知识是截止到2010年,那么在2010年之后到现在发生的事情它就一概不知,无法生成正确答案。”
众人不由得点了点头。
罗靖接着说道:“这种死记硬背就显得灵境gpt很不灵动,也意味着灵境gpt只有知识而没有常识。再举个例子,比如灵境gpt一本正经的告诉你关羽跟宋江是结拜兄弟,这种人工智障的情况就避免不了。”
在场的人们不禁哄堂一笑。
罗靖接着说道:“要避免这个问题不是没有解决方案,便是从知识图谱着手。以符号的方式,结构化的描述物理世界中的概念及其相互关系,比如‘人有脚’,其中‘人’是主体,‘有’是关系,‘脚’是受体,通过这种方式让灵境gpt拥有常识推理能力。”
“有了知识图谱后,比方说灵境gpt拥有了《三国演义》和《水浒传》里的人物关系图谱,推导之后就能得出关羽和宋江根本就不是结拜兄弟,两者半毛钱关系都没有。”
值得一提的是,知识图谱的研究历史最早可以追溯道上个世纪六十年代,从第一代人工智能符号ai的时候已经开始有人做了,当时对于知识图谱的定义就是“符号ai的逻辑表示”,但构建一个通用型的知识图谱实在太难太难了。
而且知识图谱也有诸多挑战性的问题待解决,比如知识的自动获取、多源知识的自动融合、面向知识的表示学习、知识的推理与应用等等。
而且构建知识图谱还特别费钱,这也许是其它企业或机构最劝退的地方,不过在罗靖这里反而是最简单的问题,因为只要股市不关门,财富的收割就能嘎嘎割的飞起,堪称无限金钱模式。
在场的工程师们明白了,数据投喂让灵境gpt拥有知识,知识图谱让灵境gpt拥有常识,这就是罗靖给灵境gpt确定下来的发展方向。
而且大家意识到这也许是未来ai的发展方向。
与会的工程师们也很清楚,即便灵境gpt只有知识没有常识那也超级恐怖,要是能够达到罗靖此前描述的效果,在场的人第一时间就能想到被颠覆的就是搜索引擎。
搜索引擎肯定要变天,灵境gpt会改变人们的搜索方式,而且很多工作都会被灵境gpt取代,会有很多人失业。
灵境gpt若是既有知识还有常识,那更不得了。
至于到底会产生什么影响,在场的人都无法预估也无法想象。
……
会议持续了一个半小时结束,罗靖把灵境gpt的语言模型开发工作任务分发下去,基础模型他已经构建完成,后面的迭代就交给底下的开发团队来做,只需要按照罗靖安排的路线推进即可。
目前公司采购的超级计算机即将落成投入运行,开发进度可以大大提高。
对于灵境gpt的第一个应用场景,罗靖和大家想的一样,那就是搜索引擎!
目前,在搜索引擎这个市场,谷歌已经退出大中华区市场,百渡已经突出重围一家独大,互联网行业就是典型的马太效应、强者恒强。
但,这也不是绝对的。
正常情况下,百渡在国内搜索引擎市场很难被打败了,除非是颠覆性的技术出现,这种情况就算是再强大的巨头,在颠覆性的技术面前也会显得苍白无力,说倒就倒,尤其是在互联网这个行业。
这会儿诺基亚这样的巨无霸就越来越凉了,在苹果等智能手机品牌的攻势之下毫无招架之力。
显而易见,接入灵境gpt的搜索引擎,必然可以颠覆百渡,乃至颠覆外头的谷歌,而且灵境gpt的能力,能够颠覆的还不仅仅是一个搜索引擎。
……