023小说网 > 其他类型 > 大白话聊透人工智能 > 小米AI放大招:让“嘴强王者”变身“家务能手”

小米AI放大招:让“嘴强王者”变身“家务能手”(1 / 1)

推荐阅读:

最近的小米合作伙伴大会,绝对是科技圈的一场“ai真心话局”。新上任的小米io团队负责人罗福利,上来就捅破了一层窗户纸——为啥现在的ai看着聪明绝顶,真让它干点家务、帮你开个车,就笨得像个新手?

答案特简单:现在的ai就是个“语言模拟器”,是个读了万卷书却从没行过万里路的“书呆子”。它靠啃海量文本数据长大,能跟你聊哲学、写代码、编段子,但它压根没见过真实世界的样子。你让它“帮我把客厅的灯打开”,它可能不知道你家客厅的灯在哪;你让它“提醒我开车转弯减速”,它不懂什么叫“转弯”,什么是“减速”的物理感觉。

而小米要干的事,就是把这个“书呆子”从聊天框里拽出来,扔进咱们的真实生活,让它学会在人车家的生态里摸爬滚打,变成一个能扛事、能干活的“全能助手”。今天咱们就掰开揉碎了说,罗福利到底想怎么干?小米发布的新模型有啥用?这事儿对咱们普通人到底意味着啥?

一、先把话说明白:ai为啥是“空中楼阁”?

罗福利上台第一句话就很炸:“ai正在以非线性的方式重演人类大脑6亿年的进化史”。这话听着玄乎,翻译成人话就是:ai进化的速度,比人类大脑的生物进化快了成千上万倍。人类花了几亿年才从单细胞生物的简单反应,进化出能思考、能创造的大脑;而ai只用了短短几年,就从只会识别图片的“小学生”,变成了能跟人对答如流的“大学霸”。

那为啥ai进化这么快?核心原因就是语言是个“超级压缩包”。罗福利说,语言是人类思维和物理世界在符号空间的投影。这句话咱们拆开看:你看到“苹果”两个字,脑子里会浮现出苹果的样子、味道,知道它能吃、能榨汁;你看到“跑步”两个字,会想到迈开腿、心跳加速的感觉。这些真实世界的体验和想法,都被压缩进了“苹果”“跑步”这些文字符号里。

大模型就是靠啃这些“压缩包”长大的。它读了亿万本书、亿万条聊天记录、亿万篇文章,从这些文字里还原出了人类的思维方式。你问它“天为什么是蓝的”,它能搬出大气散射的原理;你让它写一篇“春天的作文”,它能给你整出花红柳绿的句子。但问题的关键在于:它只知道“文字里的世界”,不知道“真实的世界”。

这就像一个人一辈子待在房间里,只靠看书了解外面的世界。他知道“游泳”是手脚划水、身体漂浮,但他从没下过水,真把他扔到泳池里,他还是会呛水;他知道“开车”是踩油门、打方向盘,但他从没摸过方向盘,真让他上路,他还是会手忙脚乱。

罗福利直接点出了当前大模型的致命缺陷:相比生物演化的稳固根基,ai的发展更像空中楼阁。生物的进化是跟真实世界互动出来的——长颈鹿为了吃高处的树叶,脖子慢慢变长;人类为了适应环境,学会了制造工具。每一步进化都有真实的物理反馈。但ai不一样,它的“进化”只发生在数据和算法的虚拟世界里,跟真实的物理规律脱节了。

这就引出了一个业内吵翻天的话题:光靠语言,能不能实现通用人工智能? 有些大佬,比如openai的伊利亚,觉得能——只要把语言模型做到足够大、足够强,它就能理解整个世界。但罗福利不这么认为。他的观点很明确:下一代智能体系统,不能只是语言模拟器,而必须是真正理解世界并与之共存的智能体。

这话啥意思?简单说就是:好的ai不能只会耍嘴皮子,还要会干活。只会聊天的ai,顶多是个“电子陪聊”;能操控你的智能家居、辅助你开车、预判你需求的ai,才是真正的“生活助手”。这个判断太重要了——它直接决定了小米未来的产品会长什么样。

如果小米觉得“语言就够了”,那它根本没必要费劲巴拉搞什么人车家生态,直接做个聊天机器人就完事了。但如果小米认定“ai必须懂物理世界”,那它就要把ai跟手机、汽车、家电、机器人这些硬件绑在一起,让ai在真实的生活场景里练手。这两条路,差的可不是一星半点。

二、小米甩出真家伙:o-v2-fsh到底是个啥?

基于“ai要融入物理世界”的判断,小米在大会上甩出了自己的王牌——o-v2-fsh大模型。罗福利明确说了,小米做agent模型(也就是能自主干活的ai),就盯三个核心方向,每一个都冲着“让ai落地干活”去的。

第一个方向:超强的代码和工具调用能力

这是ai从“聊天”到“干活”的关键一步。咱们现在用的ai,大多是“你问我答”的模式——你问它“明天天气怎么样”,它告诉你“晴转多云,20度”;你问它“怎么订外卖”,它给你讲步骤。但小米的这个模型不一样,它不是“告诉你答案”,而是“直接帮你办事”。

举个例子:你跟它说“帮我查一下明天的天气,如果下雨就订个外卖,顺便叫个车上班”。正常的ai会给你一串文字:“明天有雨,外卖平台链接是xxx,打车软件链接是xxx”。但小米的模型,会直接调用天气api查天气,发现下雨后,自动打开外卖平台帮你下单你爱吃的牛肉面,再打开打车软件帮你预约明天早上8点的车。全程不用你动手,它自己就能把一整套流程跑完。

为啥能做到这点?因为它会写代码、会调用工具。代码是控制数字世界的“语言”,工具是连接数字世界和物理世界的“桥梁”。ai学会了写代码,就相当于拿到了操控各种app、设备的“钥匙”;学会了调用工具,就相当于有了帮你办事的“手脚”。这才是agent模型和普通聊天机器人的本质区别——一个是“纸上谈兵”,一个是“真刀真枪”。

第二个方向:极致的推理效率

光会干活还不够,还得干得快。你想想,要是你跟ai说“帮我订个外卖”,它吭哧吭哧思考十分钟才给你下单,你早就不耐烦了。咱们普通人用ai,要的就是“秒回”“秒办”。

为了让ai思考得又快又准,小米用了一个叫hybridswa的架构,还搞了三层tp推理加速。这些技术名词咱们不用懂,只要记住一个结果:在同等水平的模型里,小米的这个模型速度能提升2到26倍。

啥概念?别人的ai思考一个复杂问题要10秒,小米的ai只要4秒左右。这个速度提升,看着是个技术细节,其实是ai落地的“刚需”。你开车的时候,让ai帮你判断前方路况,它要是慢半拍,可能就错过了最佳的减速时机;你用ai控制智能家居,它要是反应迟钝,你说“关灯”,等它关完灯,你都已经走到卧室了。只有推理效率提上来,ai才能真正融入咱们的日常生活,而不是变成一个“慢吞吞的累赘”。

第三个方向:全新的训练方法

罗福利提到,他们用了一种叫dedetokenlevel强化学习的方法。这个名字听着拗口,咱们还是说人话:这是一种让ai更稳定、更高效学习的方法。

咱们可以把ai的训练想象成“刷题”。普通的训练方法,就是让ai一遍遍地做同样的题,错了就改,但效率不高。而小米的这种方法,相当于给ai找了个“聪明的老师”——老师会根据ai的错题,针对性地出练习题,让ai在最短的时间内补上自己的短板。这样一来,ai不用做那么多无用功,就能更快地掌握干活的技能,而且不容易出错。

说完这三个核心方向,再回头看o-v2-fsh这个模型本身。罗福利特别强调:这个模型并不大。现在很多科技公司搞大模型,都在比“谁的参数量更大”——动不动就是几千亿、上万亿参数,仿佛参数越多,模型就越厉害。但小米反其道而行之,这个模型的参数量只有几百亿,属于“小而精”的类型。

但别小看这个“小模型”,它已经能做很多酷炫的事了。比如,它能通过htl代码模拟一个完整的操作系统,你在这个模拟系统里点鼠标、开软件,跟真实的电脑没啥区别;它能模拟太阳系的运行,告诉你地球怎么绕着太阳转,月亮怎么绕着地球转;它还能画一棵圣诞树,从树干到树枝,再到树上的彩灯,都画得有模有样。

这些功能看着像是“炫技”,其实背后藏着小米的野心——这个模型已经初步具备了“模拟世界”的能力。它不再是只知道文字的“书呆子”,而是能通过代码和图像,构建出一个虚拟的物理世界。有了这个基础,它再去操控真实世界的设备,就容易多了。

三、最狠的一步棋:为啥小米要把模型开源?

更让人意外的是,小米宣布:o-v2-fsh发布即开源,模型权重、技术报告、api全部公开,而且api限时免费。这个决定,在ai圈里绝对是“重磅炸弹”。

现在很多科技公司搞大模型,都喜欢“闭源”——把模型藏起来,只给用户提供有限的接口,想用就得花钱。小米为啥反着来?罗福利说了一句话:开源本质上是一种分布式的技术加速主义。这话翻译过来,就是“一个人走得快,一群人走得远”。

小米开源这个模型,有三个实实在在的好处。

好处一:降低自己的研发成本

搞大模型是个“烧钱”的活儿——要租算力、要雇工程师、要不断优化模型。就算是小米这样的大公司,单靠自己的团队,也很难面面俱到。把模型开源之后,全世界的开发者都能免费使用这个模型,他们会在使用的过程中发现模型的bug,提出改进建议,甚至直接给模型写优化代码。

这些开发者相当于给小米免费打工,帮小米完善模型。小米不用花一分钱,就能得到成千上万的“编外工程师”。这比自己关起门来搞研发,效率高多了。

好处二:迅速扩大技术影响力

开源就像“撒种子”。小米把o-v2-fsh这个“种子”撒出去,全世界的开发者都会用它来做各种各样的产品——有的可能用它做一个智能家电助手,有的可能用它做一个车载导航系统,有的可能用它做一个儿童教育机器人。

这些产品越多,就有越多的人知道“小米的模型好用”。久而久之,小米的ai技术就会渗透到各行各业,形成一个庞大的生态。到那个时候,就算别的公司再搞类似的模型,也很难撼动小米的地位。

好处三:反哺小米的硬件生态

这才是小米开源的终极目的。小米不是一家纯软件公司,它的核心业务是手机、汽车、智能家居这些硬件。把ai模型开源之后,开发者们做出来的各种ai产品,都能很方便地跟小米的硬件对接。

比如,一个开发者用小米的模型做了一个智能窗帘助手,这个助手就能直接控制小米的智能窗帘;一个开发者用小米的模型做了一个车载语音系统,这个系统就能直接装到小米的汽车上。这样一来,小米的硬件就会变得越来越智能,越来越好用,用户也会越来越离不开小米的生态。

罗福利甚至说:开源是实现agi(通用人工智能)普惠化的唯一路径。这话听起来有点理想主义,但其实是小米的“战略阳谋”。agi不是一家公司能单独搞出来的,它需要全人类的智慧共同推动。小米开源模型,就是想让更多人参与到agi的研发中来,同时也让自己站在这场技术革命的最前沿。

四、反常识的观点:ai的终极护城河不是算力和数据?

在ai圈里,大家聊得最多的就是“算力”和“数据”。很多人觉得,谁的服务器多、谁的算力强,谁就能搞出更好的模型;谁的训练数据多、谁的数据质量高,谁就能在ai竞赛中领先。

但罗福利直接否定了这个观点。他说:算力和数据不是最终的护城河。

这话一出,估计很多人都懵了——那啥才是ai的终极护城河?罗福利的答案很简单:科学的研究文化与方法,以及将未知问题转化为可用产品的能力。

这个答案,真的很反常识。算力和数据是“硬通货”,有钱就能买——你想买多少服务器,就能买多少;你想搞多少数据,就能搞多少。但研究文化和方法论,是“无形资产”,不是砸钱就能砸出来的。

这就像两个学生考试:一个学生家里有钱,买了一大堆辅导资料,请了最好的家教,但他自己不爱学习,方法也不对,成绩照样上不去;另一个学生家里没那么多钱,但他爱钻研,有一套自己的学习方法,成绩反而能名列前茅。

小米的ai团队,就是罗福利口中的“第二个学生”。他在演讲里特别提到,小米的大模型团队是一个“小而美”的团队——人不多,但个个都是精兵强将。这个团队最大的特点,就是“研究、产品与工程深度耦合”。简单说就是:搞研究的人懂产品,搞产品的人懂工程,搞工程的人懂用户。

这样的团队,能把一个看似虚无缥缈的技术概念,变成一个普通人能用、好用的产品。咱们普通人用过不少ai产品,有的功能很强,但操作复杂得要命,普通人根本不会用;有的操作简单,但功能太鸡肋,根本没啥用。这些产品的问题,就出在“研究和产品脱节”——搞技术的人只顾着炫技,根本没考虑用户的实际需求。

而小米的团队,从一开始就把“用户需求”放在第一位。他们搞ai技术,不是为了“比别人厉害”,而是为了“让用户的生活更方便”。这种“技术服务于产品,产品服务于用户”的文化,才是小米ai真正的护城河。

罗福利还在现场公开招聘,说他们要找的是“真正热爱技术,愿意探索未知的人”。这话透露出的信息很明确:小米不想走捷径,不想靠砸钱买算力、买数据来搞ai,而是想沉下心来,建立自己的技术壁垒。

五、对普通人来说,这意味着什么?

说了这么多技术和战略,咱们最关心的还是:小米的这些动作,到底能给咱们的生活带来什么改变?

罗福利在会上展示了小米的o系列大模型家族,一共五个模型,个个都冲着“落地干活”去的。

1 推理大模型(o-v2-fsh):负责复杂推理任务,比如帮你规划出行路线、处理工作文档。

2 视觉推理大模型:不只是能识别图片里的物体,还能理解场景——比如它能看出你“在厨房做饭”,然后自动帮你打开抽油烟机。

3 原生端到端音频生成模型:能生成自然的语音,不是那种机械的合成音——以后你的手机语音助手,说话会像真人一样自然。

4 端侧视觉语言大模型:能在手机、手表这些设备本地运行,不用联网也能用——就算你在没信号的深山里,也能让ai帮你识别植物、动物。

小主,这个章节后面还有哦,请点击下一页继续阅读,后面更精彩!

5 具身大模型:专门用来控制机器人和智能硬件——以后你的扫地机器人,会自己规划清扫路线,还能避开障碍物;你的智能汽车,会自己判断路况,帮你安全驾驶。

这五个模型,会分别应用在小米的手机、pc、穿戴设备、iot设备和汽车上。咱们可以想象一下未来的生活场景:

- 早上起床,你的小米手机会根据你的睡眠数据,判断你昨晚睡得好不好,然后用自然的语音叫醒你:“今天天气不错,要不要去公园跑个步?”

- 你出门上班,你的小米汽车会自动帮你规划最佳路线,避开拥堵路段;开到路口的时候,它会提醒你:“前方有行人,请注意减速。”

- 你下班回家,你的小米智能家居会提前帮你打开空调,调好温度;你说“我想看电影”,它会自动帮你打开电视,拉上窗帘,关掉客厅的灯。

- 你周末在家做饭,你的小米冰箱会根据里面的食材,给你推荐菜谱;你切菜的时候,它会提醒你:“小心刀手。”

这些场景,不是科幻电影里的想象,而是小米正在努力实现的目标。罗福利说,他刚开始研究ai的时候,开源模型和顶尖模型的差距有三年;现在,这个差距已经缩短到几个月了。技术迭代的速度,真的超出咱们的想象。

小米计划2026年投入400亿研发费用,很大一部分都会花在ai上。按照这个速度,两三年后,咱们用的小米设备,会和现在完全不同——不再是一个个孤立的硬件,而是一个互联互通、智能贴心的“生活伙伴”。

六、最后想说的话

小米这次的发布会,让咱们看到了一个不一样的ai方向。现在很多公司搞ai,都在比“谁的模型参数更大”“谁的算力更强”,但小米却把目光投向了“让ai落地干活”。

这条路,可能比单纯搞大模型更难——它需要ai和硬件深度融合,需要技术和用户需求紧密结合,需要长期的投入和耐心。但这条路,也是最有价值的路。

毕竟,对咱们普通人来说,能帮我们干活的ai,才是好ai。一个只会聊天的ai,顶多是个“电子玩具”;一个能融入我们生活、帮我们解决实际问题的ai,才是真正的“生活助手”。

从“语言模拟器”到“理解物理世界的智能体”,从“闭源垄断”到“开源普惠”,从“比拼算力数据”到“深耕研究文化”,小米的这些选择,正在为ai的未来指明一个新方向。

这条路能不能走通?时间会给出答案。但至少,小米已经迈出了最坚实的一步。而咱们普通人,只需要静静等待——等待那个“懂你、帮你、陪你”的ai,真正走进咱们的生活。

章节报错(免登录)
最新小说: 人在吞噬,盘龙成神 分家后,我打猎捕鱼养活一家七口 阳间路,阴间饭 人在超神,开局晋级星际战士 名义:都这么邪门了还能进步? 兽语顶流顾队宠疯了 迷踪幻梦 重生汉末当天子 国师大人等等我! 顾魏,破晓时相见