5月19日,腾讯云发布公告称,腾讯云智能体开发平台中提供的 Hy3 preview、DeepSeek-V4-Pro 模型,将于北京时间2026年5月27日10:00起结束限时免费公测,转为正式商用服务,根据模型调用按量计费。付费概述显示,限免结束后,Hy3 preview模型输入价格为0.002元/千tokens,输出价格为0.008元/千tokens,缓存价格为0.0008元/千tokens;DeepSeek-V4-Pro 模型输入价格为0.012元/千tokens,输出价格为0.024元/千tokens,缓存价格为0.001元/千tokens。
4月24日,HERE Technologies与百度地图在2026北京车展上共同宣布,双方已签署战略合作备忘录。未来,双方将携手为全球车企打造先进车载导航与智能驾驶地图解决方案。双方计划将HERE在全球车企生态与位置数据能力方面具有的独特优势,与百度地图在车道级导航量产经验及AI技术落地方面已经形成的规模化实践相结合。
4月23日,腾讯混元Hy3 preview语言模型发布并开源。这是一个快慢思考融合的混合专家模型,总参数295B,激活参数21B,最高支持256K上下文长度。据介绍,这是混元迄今最智能的模型。今年2月,腾讯混元重建了预训练和强化学习的基础设施。腾讯首席AI科学家姚顺雨表示,Hy3 preview是混元大模型重建的第一步,混元在继续扩大预训练和强化学习的规模并提升模型的智能上限。
4月13日,智元宣布推出面向具身作业场景的零代码应用平台——Genie Studio Agent。据介绍,这是一套贯穿机器人从开发到部署、从运行到优化的全生命周期软件基础设施,覆盖VLA模型、强化学习、视觉感知、运动控制、导航规划等核心能力。
4月10日,智元正式发布Genie Envisioner World Simulator2.0(GE-Sim2.0)。据介绍,GE Sim2.0能够严格响应机器人动作信号,生成高保真的环境变化,并严格遵循物理与语义逻辑。模型支持分钟级长时序稳定推演。多视角视觉、跨视角3D一致性与机器人本体状态(proprioception)被统一建模。内置激励模型(General Reward Model),使模型首次具备自评估能力。随着推理效率的提升,GE2-Sim已经可以接近实时运行,支持Eval in WM、RL in WM、以及Teleoperation in WM都可以直接在模型世界中完成。
继7日开源真实场景采集的数据集后,智元(AGIBOT)8日再次发布Genie Sim 3.0一站式仿真开发平台的新突破。该平台通过环境生成、场景泛化、数据采集到模型评测的全流程仿真,系统性重塑了具身智能研发范式,旨在与AGIBOT WORLD 2026数据集形成强协同效应,加速具身智能从数据采集到仿真验证的全链路发展。
3月17日,美国自动驾驶软件公司Applied Intuition宣布与英伟达达成技术合作。双方将共同加速面向全球汽车制造商的L2+级高速公路驾驶辅助系统开发与部署。Applied Intuition成为英伟达硬件平台优化的L2+系统推荐软件供应商,为OEM厂商提供仿真、验证及量产就绪软件工具链。合作旨在缩短开发周期、提升系统安全性和量产效率。此次合作不涉及股权交易,属战略技术协同。
2月12日,RoboScience 机器科学宣布完成数亿元Pre-A轮融资。本轮融资由普华资本领投,达晨财智、长石资本、香港慧科科创、天启资本跟投,老股东招商局创投、零一创投等持续加码。华兴资本担任本轮融资独家财务顾问。本轮融资将主要用于持续深化其核心的VLOA大模型技术,以加速实现打造通用机器人的愿景。RoboScience 机器科学推出了融合具身世界模型与具身操作大模型的端到端?VLOA(Vision-Language-Object-Action)大模型,旨在打造一个可适用于任何任务、任何对象与任何机器人的通用智能系统。
2月7日,Alphabet 旗下的自动驾驶汽车公司 Waymo,推出了最新世界模型 Waymo World Model,其基于 DeepMind 的 Genie 3 构建,在大规模、超真实自动驾驶仿真方面树立了全新的行业标杆。
近日,谷歌正式开放世界模型Genie 3的实验性研究原型Project Genie。一夜间暴打了游戏公司市值。《GTA》开发商Take-Two Interactive缩水10%,在线游戏平台Roblox 下跌了超过12%,最惨的是游戏引擎制造商Unity下跌了21%。
12月23日,“首届雷达时空智能技术与应用前沿发展研讨会”在无锡梁溪举行。会上,“梁溪·天筑一号·Hawkview-1首星”出征,这颗具备0.5米高分辨率、单星干涉成像能力的X波段合成孔径雷达卫星,未来将持续为城市安全、基础设施监测等提供高价值空间信息。
据报道,12月16日,OpenAI表示,已任命英国前财政大臣乔治·奥斯本(George Osborne)出任总经理,负责“OpenAI for Countries”计划,相关任命将于明年1月生效。该项目旨在推动公司与各国在人工智能基础设施和应用层面的合作,被视为OpenAI“星际之门”数据中心计划的海外延伸。OpenAI称,奥斯本将负责该项目的扩展,并预计出席下月的达沃斯世界经济论坛。
近日,小米宣布具身大模型MiMo-Embodied正式发布并全面开源。据小米方面介绍,该模型同步支持具身智能三大核心任务(可供性推理、任务规划、空间理解)与自动驾驶三大关键任务(环境感知、状态预测、驾驶规划),形成全场景智能支撑。
当地时间11月3日,电动飞机制造商Beta Technologies以每股34美元的价格发行股票,高于此前公布的发行价区间,筹集到近10.2亿美元。
11月3日,HERE Technologies与高德达成战略合作,将为中国汽车品牌联合开发先进的、AI驱动导航及数字座舱解决方案。
智能眼镜和眼动追踪解决方案提供商Viewpointsystem本周宣布推出其第三代眼动追踪智能眼镜VPS Next ,专为专业和工业用途而设计。据了解,VPS Next采用灵活的模块化设计,型号起重38克,并提供多种配置,包括经过认证的安全眼镜和无框无镜片选项。该眼镜旨在为各种用户和任务提供安全舒适的佩戴体验。Viewpointsystem表示,该系统可立即投入使用,并通过镜架上的一个多模式按钮进行操作。VPS Next平台支持从佩戴者视角向智能手机、笔记本电脑或平板电脑实时传输视频,方便远程专家提供实时支持和沟通。该系统支持实时音频和视频协作,并支持直接在视频流中添加注释。此外,系统还可以记录并自动分析眼动追踪数据,包括热图和注视点。数据甚至可以实时显示,让佩戴者的注意力实时可见。
当地时间9月29日,亚马逊支持的电动飞机制造商Beta Technologies申请美国IPO。
9月17日,日本地图数据供应商GeoTechnologies宣布与谷歌达成资本与业务合作,双方将共同优化谷歌地图在日本的服务,开发基于人工智能的地图数据库,并将技术应用于自动驾驶汽车安全领域。
8月14日消息,智元机器人推出面向真实世界机器人操控的统一世界模型平台Genie Envisioner(GE)。 不同于传统“数据—训练—评估”割裂的流水线模式,GE将未来帧预测、策略学习与仿真评估首次整合进以视频生成为核心的闭环架构,使机器人在同一世界模型中完成从“看”到“想”再到“动”的端到端推理与执行。
8月6日消息,谷歌DeepMind宣布推出第三代通用的世界模型Genie 3,可以生成前所未有的多样化交互式环境。给出文本提示,Genie 3可以生成动态世界,可以以每秒24帧的速度实时导航,并以720p的分辨率保持几分钟的一致性。与前代模型(如 Genie 1/2)和视频生成模型(如 Veo 2,Veo 3对直觉物理学的深刻理解)相比,Genie 3是第一个允许实时交互的世界模型,同时其一致性和真实感也得到了提升。