023小说网 > 其他类型 > 大白话聊透人工智能 > Manus:能自己干活的AI,到底牛在哪?

Manus:能自己干活的AI,到底牛在哪?(1 / 1)

如果你经常用ai,可能早就习惯了“问一句答一句”的模式——让写报告得先给框架,让查数据得自己贴链接,稍微复杂点的任务就得拆成十几次对话,最后还得自己拼成果。但2025年3月中国团队发布的an,彻底打破了这种“被动响应”的套路。它不是普通的ai聊天工具,而是能像真人一样“手脑并用”的智能助手,甚至被称为“全球首款通用型ai智能体产品”。今天就用最实在的大白话,把an的来龙去脉、核心能力和实际用处讲透,让你一看就懂它到底能帮你解决啥问题。

一、先搞明白:an不是“聊天ai”,是“能自己干活的ai员工”

很多人刚听说an,会以为它是又一个“升级版大模型”,但其实它和我们平时用的ai完全不是一回事。要理解它,得先分清两个关键概念:普通ai大模型和ai智能体。an就是典型的“ai智能体”,这身份差得可不是一点半点。

1 名字里藏着门道:“an”为啥叫“双手”?

an这名字不是随便起的,源自it(麻省理工)的校训“ns et an”,翻译过来是“心灵与双手”,其中“an”就是“双手”。这名字直接点出了它的核心定位:不像普通ai只靠“心灵”(大脑)回答问题,它更强调“动手”——自己操作电脑、调用工具、完成任务,把想法变成实实在在的成果。

打个比方:普通ai就像“只会说的军师”,你问它“怎么打胜仗”,它能列出十条策略,但不会自己带兵冲锋;而an是“既能谋划又能打仗的将军”,听完你的目标,会自己调兵遣将、排兵布阵,最后给你带回来胜利的结果。

2 本质区别:普通ai“等指令”,an“主动干”

要真正分清两者的不同,咱们拿“做一份特斯拉股票分析报告”来对比,差距一下子就出来了:

普通ai(比如gpt-4、文心一言)的操作流程:

1 你得先问:“特斯拉最近的财务数据在哪找?”官网、财经网站;

2 你自己去搜数据,复制粘贴给它,再问:“这些数据能看出啥趋势?”

3 你接着问:“怎么用这些数据做swot分析?”

4 你得自己把分析填进框架,再问:“能做成带图表的报告吗?”它可能给你文字描述,但没法直接生成excel图表;

5 最后你得自己整合所有内容,排版、插图表,花大半天才能出成果。

1 你只需要说一句:“帮我做一份特斯拉股票分析报告,要包含财务数据、趋势分析和swot矩阵,带可视化图表。”

2 它可能会补问一句:“需要近1年还是3年的数据?要重点分析北美市场吗?”的需求不明确)

3 接下来你啥也不用管:它自己打开浏览器,去sec官网扒财务报表,去财经平台抓股价数据,甚至爬取行业新闻做趋势判断;

4 然后它在自己的“虚拟电脑”里用python处理数据,用工具生成折线图、饼图;

5 20多分钟后,直接给你发过来一份完整的报告——有文字分析,有自动生成的图表,还标清楚了每段数据的来源,能直接下载用[__lk_in]。

这就是最核心的差距:普通ai是“被动响应”,an是“主动执行”。它不需要你一步步教,给个目标就能自己把事儿办了,甚至能处理过程中出现的小问题,比如网页加载慢了会刷新,数据不全了会换个来源找。

3 官方给的定位:全球首款“通用型ai智能体”

这里得解释一下“通用型ai智能体”这几个字。“智能体”(agent)简单说就是“能自主行动的ai系统”,而“通用型”意味着它不是只能干一件事——不像专门的“简历筛选ai”只懂看简历,也不像“数据分析ai”只懂算数据,an既能干办公的活,又能做生活的事,还能搞专业领域的任务,就像一个“全能员工”。

而且它的性能是经过权威认证的:在gaia基准测试(专门测复杂ai任务的“考试”)里,an的复杂任务完成率达到914,比openai的同类产品高出23个百分点,在法律审查、旅行规划这些精细活上表现尤其突出[__lk_in]。这就相当于班里的“学霸”,难题正确率比第二名高一大截。

二、拆解an的“超能力”:它凭啥能自己干活?

an能做到“主动执行”,不是靠魔法,而是靠一套藏在背后的“硬核配置”。就像一辆能自动驾驶的汽车,得有雷达、摄像头、控制系统一起配合,an也有自己的“四大核心部件”,咱们一个个拆开来聊。

1 第一部件:“超级大脑”

如果说an是个“ai员工”,那认知控制中枢就是它的“大脑”,负责理解需求、思考方案。但这个“大脑”比普通ai的脑子更聪明,因为它结合了两种能力:

一边是“语言理解”

它用了大语言模型(和gpt、文心一言的核心技术类似),能听懂你说的“人话”,哪怕你表达得含糊。比如你说“帮我整个适合带爸妈去日本的7天游,得有温泉还能吃海鲜”刻抓住几个关键信息:出行人是“你+爸妈”(可能需要考虑行程舒缓)、目的地“日本”、时长“7天”海鲜”,不会理解成“你自己去日本玩7天”。

另一边是“逻辑推理”

它还加了“知识图谱”技术,就像脑子里装了一张“逻辑地图”,能把零散的信息串起来,避免犯低级错误。比如在医疗诊断场景里,普通ai可能只看“发烧+咳嗽”就说是感冒,但an会结合“病人年龄65岁+有糖尿病史+咳嗽持续两周”这些信息,推理出可能是更复杂的情况,决策准确率能达到897,比纯大模型方案高34个百分点[__lk_in]。

简单说,这个“大脑”既能听懂你的话,又能像专业人士一样理性分析,不会“想当然”。

2 第二部件:“灵敏感官”态感知系统

人类干活得靠眼睛看、耳朵听,an也一样,它的“感官”就是多模态感知系统,能处理的不只是文字,还有图片、声音这些信息。

眼睛:能“看”

它的视觉模块用了vit-22b模型,每秒能解析60帧画面,比人类的视觉反应还快。比如你给它发一张超市价签的照片,它能立刻认出上面的商品名、价格;要是给它一段工厂流水线的视频,它能找出哪个环节的零件放错了位置。

耳朵:能“听”

更牛的是“跨模态对齐”

就是它能把文字、图片、声音“打通”理解。比如你说“找一张和‘秋天的故宫角楼,阳光照在红墙上’差不多的图”,它能把你的文字描述和图片特征对应起来,准确找到你要的图;反过来,你给它一张猫咪的照片,让它“编一段猫咪晒太阳的可爱文案”,它也能立刻匹配场景写出来。

有了这些“感官”,an就不用只靠文字打交道了,像真人一样能看、能听,处理任务的范围一下子宽了很多。

3 第三部件:“行动能力”规划与执行系统

这是an最核心的“杀手锏”,也是它和普通ai的本质区别——普通ai只有“脑子”没有“手”,而an有一套能自己“动手干活”分两步把任务落地:

第一步:把复杂任务拆成“小事儿”

面对复杂任务,它会像项目经理一样做拆解。比如你让它“帮hr筛选25份应聘产品经理的简历,挑出匹配度最高的3个”动拆成这几步:

1 先解压简历文件(如果是压缩包);

2 逐个读取简历,提取关键信息:工作年限、是否做过产品经理、会用哪些工具(axure、figa等)、有没有成功案例;

3 对照招聘要求给每个候选人打分(比如工作年限3年以上加20分,会axure加15分);

5 生成带评分明细的excel表格。

这种拆解不是瞎拆的,它用了“分层强化学习”和“蒙特卡洛树搜索”技术,能找到最高效的执行顺序,就像咱们干活前先列清单,确保不遗漏、不返工[__lk_in]。

第二步:在“虚拟电脑”

最神奇的是它的“执行”环节——它不是在你的电脑上瞎点,而是在云端的“沙盒虚拟机”里操作,相当于给它配了一台专属电脑,既不会影响你的设备,又能模拟真人的所有操作:

- 能打开浏览器:输入网址、搜东西、翻页面、点链接,甚至能处理简单的验证码(复杂的会提示你帮忙);

- 能用办公软件:打开word写报告、用excel做表格、用ppt排版,还会用快捷键;

- 能调用工具:自动生成python代码做数据分析、用设计工具出简单的图、甚至能写游戏代码;

- 能多线程工作:同时打开好几个网页或软件,像真人一样在不同任务间切换。

有个真实案例特别能说明问题:某科技公司让an处理500份简历,它2小时就完成了解压、提取信息、评分排序,还生成了排名表,准确率比人工高35,而以前hr得花4个小时才干完[__lk_in]。这就是“自己动手”的威力——不用人盯着,全自动出结果。

4 第四部件:“记忆功能”住关键信息

an还有“记忆力”,能记住之前的任务和信息,不会像普通ai那样“聊完就忘”。比如你上周让它做过“2024年珠宝行业市场分析”,这周再让它“更新一下这份报告,加2025年第一季度的数据”,它不用你重新给资料,能直接调出上周的报告框架和数据来源,在此基础上补充新内容。

而且它还有“checkpotg机制”,每15分钟自动保存一次任务状态。万一遇到网络中断或者系统故障,恢复后能接着之前的进度干,不用从头再来,这就降低了任务中断的风险[__lk_in]。就像咱们写文档时自动保存,不怕突然断电丢内容。

这四个部件凑在一起,an就成了一个“有脑子、有感官、有手、有记忆”的完整智能体,能自主完成从“理解需求”到“输出成果”的全流程。

三、an的真实用法:这些场景里它能帮你省大劲

讲了这么多技术,可能还是有点虚。其实an最厉害的地方是“接地气”,不管是上班干活、上学学习,还是日常生活,都有能派上用场的场景。咱们分7个最常见的领域,看看它具体能干嘛。

1 商业分析:帮老板做决策,比分析师效率高3倍

企业里的分析师、市场部员工最需要这功能,因为他们天天要处理数据、写报告,而an能把这个过程从“几天”压缩到“几十分钟”。

你只需要说“帮我做一份特斯拉近3年的股票分析报告,要包含财务数据、swot分析和未来6个月的预测”

- 自动爬取特斯拉的财报数据(营收、利润、毛利率)、股价走势、行业政策;

- 用专业模型(比如granger因果检验)分析数据,找出股价和销量、利润率的关系;

- 做swot分析:优势(技术领先)、劣势(产能不足)、机会(新能源补贴)、威胁(竞争对手降价);

- 生成带动态图表的报告,预测准确率比彭博终端还高12[__lk_in]。

有案例显示,用了an后,分析师的决策效率提升了80,以前花一天做的报告,现在不到2小时就能搞定。

如果公司要找供应商,an能帮你“筛出靠谱的”:你说“找生产电子产品外壳的供应商,要求roi≥15,交货期不超过15天,在华东地区”

- 爬取b2b平台(比如阿里巴巴)的供应商信息;

- 核对每家的报价、交货期、过往客户评价;

- 计算roi(投资回报率),剔除不符合要求的;

- 生成带风险提示的采购建议书,比如“xx供应商价格低但交货期不稳定,建议备选”。

这一下就把采购从“挨个打电话问”的繁琐里解放出来了。

2 办公自动化:hr、行政的“全能助手”

办公室里的重复劳动最磨人,而an简直是为这些活量身定做的,能把“几小时的活”变成“几分钟搞定”。

这是hr的高频任务,以前筛25份简历可能要4小时,an8分钟就能搞定:

- 自动读取简历里的关键信息:工作年限、技术栈、项目经验;

- 对照招聘要求打分,比如“招java开发,要求3年经验+会sprg boot”符合的候选人加分;

- 生成excel表格,列清楚每个候选人的得分、匹配点、劣势,准确率比人工还高35[__lk_in]。

某科技公司用它筛500份简历,2小时就出了排名表,hr直接按表约面试就行。

行政、法务经常要审合同,怕漏了风险条款,an能当“第二双眼睛”:你把租赁合同发给它,说“检查有没有和《民法典》冲突的条款,标出来风险点”

- 找出风险点,比如“租期超过20年(违法)”

- 用红色标注出来,附上法律依据,准确率高达943[__lk_in]。

这比人工审合同快多了,还能避免因为“看漏了”导致的法律风险。

3 教育领域:老师备课、学生学习的“好帮手”

不管是老师还是学生,an都能帮着“减负增效”,尤其是处理学习资料、做课件这些事。

中学物理老师要讲“动量定理”,让an“做一份互动课件,包含动画和实验模拟”

- 整理动量定理的知识点、公式、例题;

- 生成htl5动画,模拟“小球碰撞”能直观看到速度变化;

- 设计实验模拟代码,学生能在网页上调整小球质量、速度,观察结果;

- 把这些整合到ppt里,老师直接拿去上课用就行[__lk_in]。

以前老师可能要花一天找资料、做动画,现在几十分钟就能出一份高质量课件。

大学生写论文要整理文献,比如“整理transforr架构的10篇核心论文,做个系统结构图”

- 找齐这10篇论文的核心观点、实验数据、改进方向;

- 标注每部分内容的文献来源,方便论文引用[__lk_in]。

这一下就把“翻十几篇论文、手动整理”的苦活给省了。

4 生活服务:帮你搞定“费时间的杂事”

日常生活里很多事要查资料、做对比,特别费时间,an能当你的“生活助理”,帮你做决策、省时间。

你说“帮我做一份从西雅图出发的7天日本文化游,要包含求婚场景,预算控制在1万美元以内”

- 查西雅图到日本的航班,挑性价比高的时间段;

- 选有文化特色的景点:京都古寺、奈良公园、东京浅草寺;

- 找适合求婚的地方:比如京都的伏见稻荷大社千本鸟居,联系当地的摄影工作室;

- 订符合预算的酒店,规划每天的行程、交通、餐厅;

- 生成带交互地图的htl手册,预算误差控制在±5以内,方案采纳率高达89[__lk_in]。

以前自己做旅行计划得花好几天,还怕漏了细节,现在直接拿现成的方案改改就行。

在纽约买房是件头疼事,要考虑学区、安全、价格,an能帮你“筛出性价比最高的”:你说“找纽约皇后区的两居室,预算80万美元以内,学区评分≥8,社区犯罪率低”

- 爬取nypd的开放数据(查犯罪率)、greatschools的学区评分、房产网站的挂牌信息;

- 把这些信息整合起来,生成包含15个维度的对比矩阵:价格、面积、学区评分、到地铁站距离、犯罪率等;

- 挑出3房源,附上优缺点分析,能把选房周期从3个月缩短到2周[__lk_in]。

这比自己挨个网站查资料、记笔记高效多了。

5 创意设计:不懂技术也能做“创意成果”

以前做游戏、设计音效得懂专业技术,现在an能帮你“零基础出成果”,不管是做简单游戏还是搞创意内容都不在话下。

你说“帮我做一个网页版的简单doo游戏,支持wasd键移动、鼠标射击”

- 用代码搭建游戏框架,设计简单的地图、怪物、玩家角色;

- 编写控制逻辑,实现wasd移动、鼠标瞄准射击的功能;

- 20分钟内完成开发并部署到网页上,你直接就能玩[__lk_in]。

就算你不懂编程,也能拥有自己的小游戏。

做视频需要特效音效,你说“帮我做一个‘鸟鸣混合蒸汽声’的奇幻音效,时长30秒”

- 合成鸟鸣的自然声音和蒸汽的机械声;

- 调整音量、节奏,让两种声音融合自然;

- 生成音频文件,专业音频工程师都认可这种效果[__lk_in]。

这比自己在音效网站上找素材、拼接方便多了。

6 数据分析:不用懂excel也能出“专业图表”

很多人怕处理数据,因为要学函数、做图表,而an能“全自动搞定”,从找数据到出图表一步到位。

亚马逊店铺老板想优化策略,说“帮我分析店铺近3个月的销售数据,找出销量低的原因,给改进方案”

- 从店铺后台导出销售数据(如果有权限),或者让你上传数据文件;

- 分析哪些商品销量差、哪个时间段流量少、客户差评集中在哪些问题;

- 用atplotlib生成销量趋势图、差评分布图;

- 给出改进建议:比如“xx商品价格比竞品高10,建议降价5”“周末流量低,建议投放周末广告”。

有个案例显示,用了an的方案后,店铺季度gv(成交总额)增长了37[__lk_in],这就是数据驱动决策的力量。

公司想知道竞品的口碑,说“帮我分析最近itter上关于苹果新品的情绪,做个热力图”

- 爬取itter上的相关帖子;

- 区分“正面”(夸好用)、“负面”(吐槽价格高)、“中性”

- 生成情绪热力图,显示不同地区、不同时间段的情绪变化;

- 总结出主要的好评点和槽点,给产品改进提建议。

这比人工翻几千条帖子高效多了,还能避免主观判断的偏差。

7 法律文书:非专业人士也能写“合规文件”

普通人写法律文件怕不合规,an能帮你“踩准法律红线”,生成的文件条款完整度很高。

比如你开了家小公司,需要一份数据合规协议,说“帮我根据《个人信息保护法》生成一份用户数据合规协议,适用于app注册”

- 对照《个人信息保护法》的要求,列出必须包含的条款:数据收集范围、使用目的、用户权利、泄露责任等;

- 撰写协议正文,确保每个条款都符合法律规定;

- 标注出需要根据公司实际情况修改的地方(比如公司名称、联系方式);

- 最终生成的协议条款完整度达986[__lk_in],基本不用再找律师修改。

这对于没法务团队的小公司来说,简直是“及时雨”。

四、an的“过人之处”干,还有这些优势

除了能完成各种任务,an还有几个特别“贴心”的优势,让它用起来比其他ai更顺手、更划算。

很多人用ai怕“黑箱操作”——不知道它怎么得出的结果,错了也没法改。但an有“运行日志”,能实时显示它的操作步骤:比如它正在打开哪个网页、提取了什么数据、为什么排除某个选项,你都能看得见。

要是发现它走偏了,比如你让它找“北京的川菜馆”,它却在搜“上海的”,你可以随时打断,说“改成北京的”,它会立刻调整方向,不用重新开始任务。这种“可干预性”特别重要,尤其是处理重要任务时,能避免出大错。

以前的高端ai工具都很贵,小企业根本用不起,但an的成本只有同类产品的十分之一。

- 轻量任务(比如筛选简历、写简单文案)用bda技术实现毫秒级响应,128gb内存的实例处理单任务成本才2美元;

- 复杂任务(比如市场趋势预测、游戏开发)虽然耗时久一点,但相比请人干的成本,还是便宜太多——比如请分析师做一份股票报告可能要几千块,an几十块就能搞定。

这就让普通人和小企业也能用上高端ai能力,不用再“望ai兴叹”。

很多人担心ai操作电脑会泄露隐私、搞坏系统,an完全解决了这个问题——它所有的操作都在“云端沙盒虚拟机”里进行,和你的本地电脑是完全隔离的。

就像给它建了个“独立的小房间”,它在里面怎么操作浏览器、用软件,都不会影响你的电脑文件,也看不到你电脑里的隐私数据。只有最终的成果(比如报告、表格)会发给你,中间过程的数据不会泄露,安全性特别有保障[__lk_in]。

4 用户满意度高,靠谱性经过验证

截至2025年7月,an已经处理了超过120万次任务请求,平均任务完成时间23分钟,用户满意度评分48\/5(满分5分)。企业客户的反馈更明显:用了之后业务流程效率平均提升300,错误率下降到人工操作的1\/5[__lk_in]。

这些数据不是吹出来的,而是实际用出来的效果,说明它确实能解决真实问题,不是“花架子”。

五、常见疑问:关于an的几个“灵魂拷问”

讲了这么多,你可能还是有疑问,比如它会不会取代人类工作?会不会出错?咱们来解答几个最常见的问题。

1 它会取代人类工作吗?

短期内不会,它更像是“人类的助手”,而不是“替代品”。它擅长的是“重复劳动、数据处理、流程化任务”,比如筛简历、做报表、爬数据这些耗时耗力的活;但人类擅长的“创意、共情、战略决策”,比如给公司定未来5年的发展方向、和客户建立深度信任、创作有情感的文学作品,an还做不到。

就像当年的计算器没取代会计,反而让会计能专注于财务分析一样,an会把人类从繁琐的劳动中解放出来,去做更有价值的事。比如hr不用再筛简历,能专注于面试、员工关系;分析师不用再爬数据,能专注于解读数据背后的商业逻辑。

2 它做的结果会出错吗?

有可能,但错误率比人工低很多。主要出在这几种情况:

- 你给的需求太模糊,比如只说“做一份市场报告”业、时间范围,它可能会出偏差;

- 遇到极端特殊的情况,比如法律条款有最新修订,而它的数据库还没更新;

- 处理验证码、复杂图片识别这些“人机区分”的任务时,可能需要你帮忙。

但它有两个减少错误的机制:一是过程透明,你能实时看到步骤,提前发现问题;二是会标注数据来源,你可以自己核对关键信息。总体来说,它的准确率(比如合同审查943、简历筛选准确率比人工高35)已经比大部分人工操作靠谱了。

3 用它需要懂技术吗?

完全不用,它对普通人特别友好。你不用学代码、不用懂算法,甚至不用知道什么是“ai智能体”,只要会说“人话”就行。比如你想做报告,直接说“帮我做xx报告,要包含xx内容”;想找资料,直接说“帮我找xx信息”,它就能听懂并执行。

就像用微信发消息一样,不需要懂后台技术,只要会打字、会说话,就能用起来。

4 它能处理中文任务吗?

当然能,因为它是中国团队开发的产品,对中文的理解和处理能力特别强。不管是写中文报告、分析中文简历、生成中文法律文书,还是理解中文的口语表达(比如“帮我整个靠谱的旅行计划”里的“整个”),它都能精准把握,不会出现“翻译腔”或理解偏差。

六、总结:an带来的到底是什么?

看到这里,你应该明白an不是“又一个ai工具”,而是人工智能的一次“范式升级”——它把ai从“回答问题的机器”变成了“能执行任务的助手”,重新定义了人类和ai的协作方式。

对个人来说,它是“省时间的利器”:不用再花几小时查资料、做表格、写报告,把这些活交给它,能多出来时间陪家人、做自己喜欢的事。对企业来说,它是“降成本、提效率的工具”:不用再招那么多做重复劳动的员工,业务流程能快好几倍,还能减少人工错误带来的损失。

更长远来看,an代表了ai的未来方向——以后的ai可能不再是“你问它答”,而是“你说目标,它出结果”。就像现在我们习惯用手机打车、外卖,而不是自己去拦车、做饭一样,未来我们可能会习惯“让ai干活”,把更多精力放在“思考目标”上。

当然,an也不是完美的,它还有进步空间:比如处理超复杂的创意任务、理解更深层次的人类情感,这些都需要技术继续迭代。但不可否认的是,它已经迈出了关键的一步——让ai从“能说会道”变成了“能工巧匠”,而这正是人工智能走进日常生活、真正帮人解决问题的核心所在。

如果你下次遇到“需要查资料、做对比、处理数据、写报告”的麻烦事,不妨试试an,说不定它能给你一个“意想不到的轻松结果”。毕竟,能让机器干活,何必自己受累呢?

章节报错(免登录)
最新小说: 穿成古代穷鬼,我卖盒饭馋哭太子 大黎武神 崩坏:天命艳妇,单推蛇蛇 千面邪妃 大秦:谁惹我那体弱多病的贤卿了 找个媳妇带回家 乖!别离婚!禁欲总裁诱吻小孕妻 在梦的另一端相遇 大明:刚奉天靖难,你让我即位? 盗墓两小无猜