智能周报|Manus走红主要功劳不是Manus团队的

时间: 2025-04-26 01:08:30 |   作者: 行业应用

  

智能周报|Manus走红主要功劳不是Manus团队的

  对于大部分人来说,Agent还是个陌生的词汇,它的英文翻译一般是「代理人」、「经纪人」,它主要指那些受到委托人信任,在一定权限内代表委托人执行任务的角色,在传统定义里这样的角色只能是人类。

  但随着计算机技术的发展,Agent早就脱离了肉体凡胎,很多可以在终端或网络中负责协调任务、管理资源的程序也开始被称作Agent,但这些Agent还是基于固定的规则来行动,而想要让Agent不拘泥于固定规则,就需要人工智能技术的提升。

  第一个提出基于大型语言模型(LLM)的Agent框架的人就是OpenAI前研究与安全副总裁翁荔(Lilian Weng),她在2023年的一篇博文中首次定义了AI Agent的三要素,分别是:

  · 记忆(Memory):包括短期记忆(如上下文窗口)和长期记忆(如外部存储与检索);

  而大语言模型将是这个AI Agent的大脑,拥有自主的分析和决策能力。从这以后,中文互联网开始逐渐将这种由AI驱动的Agent翻译成智能体。从去年下半年开始,智能体就慢慢的变成为AI圈的热门线月,OpenAI的最大竞对Anthropic推出了一个名为「计算机使用」(computer use)的新功能,这个功能让大模型能代替用户操控电脑。之后国内AI勇于探索商业模式的公司智谱也推出了两个类似的智能体CogAgent与AutoGLM,前者代替用户操控计算机,后者操控网页和手机。

  看着这些智能体为了买一杯咖啡在不同App之间比价、下单、结账,确实一度令人感到新奇,不过这种新奇感与看到一个婴儿首次站立行走并无区别,它只是长出了手和脚,但并不代表它有了个好脑子。

  而本周Manus的火爆,则主要归功于它智能上的提升,分析财报、制作表格、创建网页和简易游戏,这些工作都远远超出了点一杯咖啡的难度。这背后的关键变量就在于,过去半年推理模型取得了巨大突破。

  最近几个月,一系列推理模型比如GPT o3、DeepSeek R1、QWQ、Claude 3.7 Sonnet等的发布甚至开源,某些特定的程度上让基础模型降低了幻觉,提升了路径规划能力、深度研究能力和代码写作的准确率。而Manus走红,只是在合适的时机推出了一款可以彻底展现当前推理模型智能水平的综合智能体。

  3月5日,一款智能体产品Manus在中文AI圈迅速走红。用户只需要告诉它最终目标,Manus就可以灵活调用各类工具,自主执行浏览网页、操作网页应用、编写并执行代码等操作来实现。在官网中,团队提供了Manus的多个用例,包括制定旅行攻略、保险政策比较分析、财报分析、制作课堂演示PPT、文档格式转换、生成小游戏等。

  Manus的走红更多得益于在产品层面的打磨,而非底层模型能力的提升。例如在分析某款股票的工作中,Manus一来要调用金融API获取数据,二来要借助Python脚本生成可视化图表,这都需要产品团队提前布置好相应的工具。消息称,团队并未自研模型,而是调用Claude和Qwen等不同模型来执行多样的工作,目前Manus的单任务运行成本约为2美元。

  使用Manus过程中,用户可以感觉到的体验感更多是computer use(电脑代操作类agent)的跨App操作能力及其可视化过程带来的,输出结果的可用性完全有赖于基础模型的能力。当然,最近几个月的一系列推理模型比如GPT o3、DeepSeek R1、QWQ、Claude 3.7 Sonnet等的发布甚至开源,以及Deep Research功能的商用,某些特定的程度上让基础模型降低了幻觉,提升了路径规划能力、深度研究能力和代码写作的准确率。这些能力为财报分析、表格生成、网页和简易游戏的生成等更具生产力的agent提供了可能。Manus为这些能力提供了综合性的体验入口。

  Manus团队主要成员包括创始人肖弘、产品合伙人张涛和首席科学家季逸超。该团队上一款AI产品Monica已积累用户数约400万,这是一款套壳类聊天助手。腾讯科技称,该公司目前共完成两轮融资,总规模超过1000万美元。

  3月5日,Google开始在搜索中测试一款名为「AI Mode」(AI模式)的新功能,它有点像是之前「AI Overviews」(AI概览)功能的升级版。AI Overviews可以在用户搜索时生成简洁的摘要总结并附上相关链接;但AI Mode更进一步,它基于Gemini 2.0开发,拥有制定计划、调用工具的能力。

  官方称,AI Mode帮用户处理复杂问题,给出综合性回答,而不是罗列出一堆网页链接。例如用户问:「智能戒指、智能手表和追踪垫的睡眠追踪功能有啥不一样的区别」,AI Mode采用多步骤方法制定查询计划并搜索以查找信息,并根据找到的内容调整答案内容。如果想知道更多信息,用户可以提出后续问题,例如「深度睡眠期间心率会发生啥变化」,以便快速获得易于理解的答复和相关链接。

  通义团队称,在冷启动基础上,QwQ-32B针对数学和编程任务、通用能力分别做了两轮大规模强化学习。在初始阶段,特别针对数学和编程任务进行了强化学习。在第一阶段的强化学习之后,研发人员还增加了另一个针对通用能力的强化学习。最终发现,通过少量步骤的通用强化学习,能提高其他通用能力,同时在数学和编程任务上的性能没有显著下降。

  此外,QwQ-32B模型还集成了与智能体Agent相关的能力,使其能够在使用工具的同时批判性思考,并依据环境反馈调整推理过程。目前,该模型已经在魔搭社区及Hugging Face开源。

  郭明錤认为,这款可折叠iPhone的定位为真正的AI手机,「多模态与跨App使用为未来AI装置的大趋势,故电子设备屏幕越大,越有利AI使用者真实的体验。例如,与聊天机器人讨论旅程时,同时呈现完整的地图App。」

  初代可折叠iPhone将采用「书本式」左右折设计。展开手机时,屏幕尺寸约7.8英寸,厚度约4.5-4.8毫米;折叠手机时,屏幕尺寸约5.5英寸,厚度约9-9.6毫米。打开与折叠时各有一个前置相机,后置相机为双镜头。另外,指纹识别功能(Touch ID)将回归,但会被集成在设备的侧边按键上,因厚度与空间限制,预期没有面部识别功能(Face ID)。

  郭明錤称,因生产难度非常高,初代可折叠iPhone预计于2026年第四季度量产,放量可能要等到2027年,2026年出货量预计为300万至500万部。第2代可折叠iPhone预计在2027年下半年量产。

  滴滴于2016年组建无人驾驶研发技术团队,2019年8月宣布旗下无人驾驶部门升级为独立公司, 专注于无人驾驶研发、产品应用及相关业务拓展,团队规模超200人,时任滴滴CTO张博兼任新公司CEO。2024年11月,张博卸任滴滴CTO,专注无人驾驶业务。

  2020年6月,滴滴首次向公众开放无人驾驶服务。2023年4月,滴滴推出其首款无人驾驶概念车「DiDi Neuron」。目前,滴滴无人驾驶部门运营由200多辆汽车组成的无人驾驶车队,已在北京、广州和上海等城市测试。

  · 2021年1月,获得3亿美元融资,投资方包括IDG资本、CPE、Paulson、中俄互助基金、国泰君安国际、建银国际等;

  · 2023年10月,获得1.49亿美元融资,投资方为广汽资本和广州开发区投资集团;

  3月3日,美国总统特朗普和台积电董事长魏哲家在白宫会面,随后共同宣布该公司将在美国再投资1000亿美元,成为美国史上顶级规模的单项外来直接投资案。台积电表示,这笔资金将用于未来数年建造3座半导体厂、2座先进封装厂和一座研发中心。此外,台积电并没有透露任何新投资的时间表,仅表示在未来4年内会在美国增加4万个岗位。

  这笔新资金使台积电在美国的总投资达到了1650亿美元。2020年,台积电在美国亚利桑那州凤凰城投资120亿美元建设了第一座5纳米晶圆厂。随后,在2023年芯片法案推动下,台积电宣布扩建第二座晶圆厂,总投资额增至400亿美元。2024年4月,台积电宣布在凤凰城再建第三座晶圆厂用来生产2纳米或更先进制程芯片,总投资额提升至650亿美元,预计2030年前投产。

  。台积电3月3日宣布的1000亿美元投资计划意味着对英特尔的收购可能不会变成现实。

  随着中美贸易冲突的升级,两国之间大宗商品的贸易流向正逐渐发生明显的变化:以大豆为例,分析人士指出,巴西有望进一步巩固中国最大大豆进口来源国的地位。美国大豆种植户警告,美国大豆可能将永远失去中国市场。

  有记者问:据多家报道,消息的人偷偷表示,特朗普政府正准备在关税谈判中向其他几个国家施压,要求其他几个国家限制与中国的贸易往来,以换取美方关税豁免。请问发言人对此有何评论?答:我们注意到有关报道。

  日前,山西省大同市中级人民法院审理席某某上诉案及所涉婚约财产纠纷上诉案的审判长接受记者正常采访:本案系不公开审理的案件,一审宣判后,鉴于网上存在大量不实信息,法院在法律规定范围内最大限度回应社会关切,澄清事实。

  潮汕英歌与海阳大秧歌同台斗舞,二者气势各异,一个靠动作,一个靠呐喊,网友:看了一场跨越南北的非遗“对话 ”

  潮汕英歌与海阳大秧歌同台斗舞,二者气势各异,一个靠动作,一个靠呐喊,网友:看了一场跨越南北的非遗“对话 ”

  玩具业是美国遭受关税冲击最严重的行业之一。美国有线电视新闻网(CNN)指出,对中国生产的玩具加征高额关税,意味着曾经物美价廉的玩具将变成“奢侈品”。美国商务部多个方面数据显示,2024年美国进口了价值177亿美元的玩具,其中75%来自中国。

  △美国加州州长纽森(资料图)美国人口和经济规模第一大州加利福尼亚州州长纽森当地时间16日宣布就关税问题起诉特朗普政府。他批评特朗普政府滥用关税政策的行为“违法”,给美国经济导致非常严重混乱和破坏。加州成为全美第一个就关税问题起诉特朗普政府的州。

  近日,深圳一市民在“深圳论坛”发帖称,自己在西丽南方科技大学医院检测肾功能,因医院血液检测结果存在严重偏差被误诊肾病。南方科技大学医院作出回复,该市民反映的情况确实存在,已对检验结果做复核修正,并向该市民诚挚道歉。通过排查回顾得出,本次检测结果出现偏差的原因可能为随机性误差(如电滋干扰、电源电压瞬间波动、振动、噪声等)或未知潜在干扰物(药物、试剂中某些物质)造成的。接下来,检验科将优化流程,对肌酐异常结果设置关联项目异常复检规则,制定审核要求,减少和杜绝类似事件再次发生。(深圳新闻网)

  山西“订婚案”维持原判,被告获刑3年,审判长答问:处女膜未破裂影不影响罪的认定?#媒体精选计划

  看清“订婚案”判决,五个关键点:(四)处女膜未破裂影不影响罪的认定?处女膜状况不能作为认定或否定罪行的依据。

  “雪绝不踏入广东一步”这话刚说完,广东人就被现实狠狠上了一课!有网友跑到粤湘赣三省交界碑打卡,镜头扫过界碑上“广东”二字的瞬间——旁边全是积雪覆盖!自家地界被白茫茫一片“包围”,广东网友直接绷不住:原来出了广东,真的全是“北方”!评论区炸锅了:“广东人:我是谁?我在哪?

  美国是全球最大的农产品出口国,中国是美国农产品出口的最大市场。而美国政府在中美贸易战中反复以“关税大棒”试图打击中国,却让本国豆农沦为政治博弈的牺牲品。当美国仍沉迷关税数字游戏时,中国早已大幅摆脱对美国农产品的依赖。中国向美国传递一个清晰的信号:谈,大门打开;打,奉陪到底!