5月28日,在比亚迪智能化战略发布会上,比亚迪集团高级副总裁、汽车新技术研究院院长杨冬生发表演讲。宣布比亚迪超级智能体迪迪虾发布,该智能体具备聊得来、搞得定、玩得转三大核心能力。其中聊得来体现为拥有全舱记忆、跨域交互、端云协同及快慢思考机制,兼具情感、记忆与主动服务特性;搞得定支持复杂意图拆解、多方言多语种识别及超快响应;玩得转则实现从手机生态到Agent生态的100%兼容。
5月19日,智象未来举办首届开放日,并正式发布基于新一代原生全模态模型架构Unified Transformer(UiT)打造的图像大模型HiDream-O1-Image-Pro。这一超两千亿参数的原生全模态图像大模型,标志着智象未来正向图像、视频、文本、音频等多模态统一建模的“原生全模态”阶段迈进。同时,智象未来宣布完成新一轮亿级融资,深创投、金浦投资、财鑫资本、复聚资本等多家机构参与。这是智象未来半个月内再次完成融资。
5月20日,在2026阿里云峰会上,阿里发布基于平头哥新一代AI芯片真武M890的128卡超节点服务器,搭载互联芯片ICN Switch 1.0,通信时延低至百纳秒级,可让128张AI芯片组成一台计算机,可支持海量Agent并发推理,满足Agentic时代的并发推理和大模型训练需求。
5月20日消息,今天凌晨,谷歌I/O 2026开发者大会开幕,谷歌在会上正式发布Gemini 3.5 Flash,并宣布面向全球所有用户开放,可免费使用。Gemini 3.5 Flash在智能水平上已接近大型旗舰模型,同时延续Flash系列高速响应的优势,是谷歌迄今能力最强的智能体与编程模型。据了解,在多项智能体和编码基准测试中,Gemini 3.5 Flash的成绩均超过上一代旗舰模型Gemini 3.1 Pro。具体来看,在Terminal-Bench 2.1测试中,Gemini 3.5 Flash得分达到76.2%,高于Gemini 3.1 Pro的70.3%;GDPval-AA达到1656 Elo;MCP Atlas得分为83.6%,位居全场最高。在多模态理解测试CharXiv Reasoning中,其得分达到84.2%,同样拿下全场最高成绩。除了性能提升,Gemini 3.5 Flash在输出速度上也表现突出,该模型输出速度超过280 token/秒,是GPT-5.5和Claude Opus 4.7的4倍。谷歌表示,凭借速度与性能之间的平衡,Gemini 3.5 Flash非常适合处理长周期智能体任务。过去开发者可能需要数天、审计人员需要数周才能完成的工作,如今在Gemini 3.5 Flash协助下可大幅缩短耗时,且使用成本通常不到其他前沿模型的一半。
5月13日,传统GEO运营商SES公司宣布取消原Intelsat公司向泰阿空间公司订购的两颗GEO软件定义卫星IS-41与IS-44订单。此次取消的IS-41、IS-44卫星是Intelsat公司2022年破产后增长计划的部分项目,原计划2027年发射,为非洲、欧洲、中东及亚洲提供宽带服务。SES公司表示,取消订单是2025年7月收购Intelsat公司后进行卫星资产优化的决定,但保留了IS-42、IS-43等4颗同系列软件定义卫星的订单,计划于2027年发射,同时依托Starfish幸运六狮电玩城公司和Infinite Orbits等服务商在2026~2029年间开展5次在轨延寿服务,以延长现有GEO卫星寿命、保障服务连续性。法国运营商Eutelsat此前也已取消Flexsat Americas项目,该卫星原计划2026年发射、2028年部署,同样基于泰阿空间公司Inspire平台,项目取消可节省超1亿美元成本。公司明确表示将“加强对GEO支出的管控”,将资本开支转向低轨星座。财报显示,Eutelsat公司一季度实现收入入2.93亿欧元(约合3.43亿美元),同比增长3.1%,其中传统GEO收入为9350万欧元,同比下降4.3%;而OneWeb低轨星座业务收入达到6220万欧元,同比增长65%,形成了鲜明对比。SES公司财报显示,2026年一季度实现收入8.47亿欧元(约合9.92亿美元),同比增长8.5%,主要得益于对Intelsat的收购。调整后营收息税折旧摊销前利润(EBITDA)同比增长57%,达到4亿欧元,增长主要由航空与政府通信业务推动,但固定数据与视频分发等传统GEO业务遭遇下行。公司同时推进O3b MEO宽带星座升级,计划年内再发射3颗mPower卫星,并在2030年前完成下一代网络部署。
5月13日,MiniMax官宣旗下Agent全面升级并新命名为Mavis,同时正式推出Agent Teams多智能体团队协作功能,并整合订阅套餐权益,补齐单智能体复杂任务短板。此次升级两大核心变化,一是桌面端支持Agent Teams,可创建不同角色智能体组队并行工作,协同完成超长、高难度复杂任务;二是合并TokenPlan与Agent Plan订阅体系,一份订阅即可打通CLI、API、Agent全部能力,涵盖M2.7、音乐、视频、语音等所有模型,额度可跨端共享。官方指出,单Agent存在四大明显痛点:复杂任务易中途无故终止、长流程任务容易逻辑跑偏、后台执行任务时无法即时响应用户、单一角色难以适配代码、文档、调研等多类专业分工需求,也是推出多智能体协作的核心原因。
5月5日消息,加拿大通信卫星公司(Telesat)公布2026年第一季度财报,其传统静地轨道卫星业务营收同比下降25%,从去年同期的1.76亿加元(约1.28亿美元)降至1.32亿加元(约0.96亿美元),当季净亏损4800万加元(约3500万美元),主要归因于美元计价债务重估产生的非现金损失。公司积压订单仍达15亿加元(约10.95亿美元),随着合同陆续交付,预计GEO业务收入下滑将于2026年底企稳。为推进光速低轨星座项目,通信卫星公司已完成子公司的债务再融资,获得12亿加元(约8.76亿美元)新信贷额度,用于维持GEO业务运营并满足光速星座项目的股权出资要求。光速星座计划于2028年中投入商业服务,目前已完成多项关键节点:与主承包商加拿大空间技术公司(MDA Space)完成卫星平台与有效载荷的关键设计评审,固化了批产技术状态;三个主要全球关口站已开工建设,挪威首个国际站进入硬件集成阶段;空间技术公司在魁北克的高产量生产线已启动,具备每周生产2颗卫星的能力,以支持由198颗卫星组成的初始星座。公司表示,光速星座专为企业及政府领域设计而非大众消费市场,GEO业务提供稳定现金流支持过渡,光速星座则是未来增长引擎。本年度重点完成用户终端原型及获取关键国际市场落地权。
4月29日,接近Genspark创始团队的信源消息,Genspark 极有可能在 2026 年被OpenAI、微软或谷歌等巨头高价并购。去年底,硅谷的AI投资圈经历了一场突如其来的地震。由华人创业团队打造的 AI Agent 明星产品 Manus,被 Meta 以数十亿美元的代价收入囊中。这不仅是 Meta 成立以来的第三大收购案,更像是一声发令枪,让全球资本的目光瞬间锁定了 Manus 的最强竞品——Genspark。2025年11月,Genspark 官宣完成 2.75 亿美元的 B 轮融资,投后估值一举达到 12.5 亿美元,正式跻身 AI 独角兽行列。更让投资人兴奋的是,其产品上线仅 45 天,就实现了 3600 万美元的 ARR(年度经常性收入)。这种在 AI 搜索与 Agent 执行层展现出的极强变现能力,正是微软、谷歌等迫切需要在通用 AI 智能体端补齐短板的巨头所渴求的。
4月29日,阶跃星辰宣布正式发布新一代图像生成编辑模型Step Image Edit 2。目前Step Image Edit 2已全量上线”阶跃星辰开放平台“和Step Plan。
4月22日消息,谷歌昨日(4月21日)发布博文,宣布升级其自主研究智能体,推出Deep Research与Deep Research Max,均基于Gemini 3.1 Pro模型打造,让智能体从复杂的摘要引擎转变为企业级工作流的基础组件。Deep Research智能体适用于交互式用户场景,平衡优化速度和效率;而Deep Research Max适合异步后台工作流,如生成详尽的尽职调查报告等,追求极致的全面性与最高质量综合,利用扩展的测试时计算进行迭代推理、搜索与精练。
4月22日,据报道,前华为天才少年、19级技术专家赵立晨已于2026年3月离职,加入杭州拉格朗日具身技术有限公司。该公司聚焦于具身智能架构研发(Agentic OS)与硬件规模化落地,试图在具身智能最关键、也最难的一层建立优势。据公开信息,赵立晨本科、硕士均就读于北航软件工程,长期聚焦3D视觉与多模态,是北航目前唯一入选华为天才少年计划的学生。2023年进入华为后,他从零搭建起20多人的团队,主导AI智家宝Agent端云架构迭代,相关项目获中国电信卓越创新奖。赵立晨表示,Agentic OS的目标是交付一套可运维的系统,将分散能力组织成可部署、可持续演进的系统,推动具身智能产业化落地。
4月22日消息,OpenAI正式推出ChatGPT Images 2.0(GPT-Image-2),为首款带“思考”能力的图像生成模型,可极简提示生成高仿真界面、海报、试卷等内容,大幅简化设计流程。主要亮点方面包含支持联网检索,可自动补全品牌、场景等信息,一句话生成宣传海报、论文长图、UI界面、试卷等成品 。在Arena.AI文生图榜单登顶第一。
4月21日,腾讯云宣布正式开源Cube Sandbox。据介绍,它是业内首个兼顾硬件级隔离与亚百毫秒启动的开源沙箱服务,原生兼容E2B接口标准,开发者仅修改环境变量即可将现有Agent应用从海外闭源方案平滑迁移,同时可支撑Agent“思考—执行—反馈”循环,覆盖应用开发到强化学习训练的完整场景。
近日,国家基础学科公共科学数据中心“地理空间数据库”的地理空间数据智能服务(GeoAgent)正式发布,标志着地理空间数据库在智能服务领域迈出关键一步。GeoAgent围绕地理空间数据的“高效检索、精准筛选、智能分析”进行建设,旨在为用户提供更便捷、更智能的一站式地理空间数据服务。
4月21日消息,理想汽车将与高德在座舱Agent方面进行深入合作,预计双方很快或将官宣。此前,理想汽车已经推出了司机AI大模型理想VLA,以司机Agent为产品形态。理想汽车CEO李想认为,在非AI时代,普通水平与顶级专家之间的差距可能是100倍;而在AI时代,这种差距或将扩大至10000倍。Agent和AI将成为“放大镜和显微镜”,放大人与人之间的专业能力差异。除了自研之外,理想也在寻求外部合作。知情人士表示,高德在出行场景的主动意图理解能力上已取得新突破。日前,高德官方已发布“高德汽车出行AI Agent”的产品宣传片,对外展示了其在“复杂意图+多点规划”“导航路线定制”“意图理解+多轮对话”等方向的能力。双方达成合作后,理想汽车也将成为首家搭载该解决方案的车企。
4月13日,智元宣布推出面向具身作业场景的零代码应用平台——Genie Studio Agent。据介绍,这是一套贯穿机器人从开发到部署、从运行到优化的全生命周期软件基础设施,覆盖VLA模型、强化学习、视觉感知、运动控制、导航规划等核心能力。
4月10日,智元正式发布Genie Envisioner World Simulator2.0(GE-Sim2.0)。据介绍,GE Sim2.0能够严格响应机器人动作信号,生成高保真的环境变化,并严格遵循物理与语义逻辑。模型支持分钟级长时序稳定推演。多视角视觉、跨视角3D一致性与机器人本体状态(proprioception)被统一建模。内置激励模型(General Reward Model),使模型首次具备自评估能力。随着推理效率的提升,GE2-Sim已经可以接近实时运行,支持Eval in WM、RL in WM、以及Teleoperation in WM都可以直接在模型世界中完成。
4月9日,腾讯宣布QClaw V2大版本上线,新版本(V0.2.5)实现多Agent、应用连接器和龙虾管家三大核心能力,支持用户创建多个Agent,每个Agent可自定义不同的专长、技能和权限;同时打通众多第三方应用,官方称单任务操作步骤可减少60%以上。针对安全问题,QClaw上线“龙虾管家”功能,在QClaw可一键开启安全防护环境,拦截恶意prompt、skill投毒、文件误删、敏感信息泄露等风险。
4月9日,MiniMax宣布发布一个面向AI Agent的命令行工具——MMX-CLI。据MiniMax介绍,接入MMX-CLI后,Agent可以在Claude Code、OpenClaw 等环境中原生调用MiniMax最新的编程、视频生成、语音合成、音乐创作等全模态模型,无需适配繁琐接口,也无需额外编写MCP Server。
继7日开源真实场景采集的数据集后,智元(AGIBOT)8日再次发布Genie Sim 3.0一站式仿真开发平台的新突破。该平台通过环境生成、场景泛化、数据采集到模型评测的全流程仿真,系统性重塑了具身智能研发范式,旨在与AGIBOT WORLD 2026数据集形成强协同效应,加速具身智能从数据采集到仿真验证的全链路发展。