在2026年谷歌I/O开发者大会上,XREAL正式发布了Project Aura智能眼镜,并宣布该产品将于2026年年底前全面出货。该设备基于安卓XR架构打造,采用“分离式计算”方案,将处理器、电池及触控模组集成进一个可夹在口袋上的外接盒,使眼镜本体重量控制在90克以内。眼镜框集成了3枚广视角摄像头用于手势识别。该产品能够原生访问全套空间应用,如Google Maps沉浸式3D导航和YouTube 180度/360度VR视频播放。产品深度集成了多模态Gemini AI,当通过DisplayPort连接至笔记本电脑时,系统可自动将平面文档、网页及移动端App实时转换并显示在视觉空间中。Project Aura搭载了XREAL自研的X1S空间计算芯片,并协同高通骁龙XR平台。目前工程版本支持约4小时的连续使用。
5月19日,智象未来举办首届开放日,并正式发布基于新一代原生全模态模型架构Unified Transformer(UiT)打造的图像大模型HiDream-O1-Image-Pro。这一超两千亿参数的原生全模态图像大模型,标志着智象未来正向图像、视频、文本、音频等多模态统一建模的“原生全模态”阶段迈进。同时,智象未来宣布完成新一轮亿级融资,深创投、金浦投资、财鑫资本、复聚资本等多家机构参与。这是智象未来半个月内再次完成融资。
5月19日,佑驾创新宣布与江苏省丹阳高新区产业发展有限公司正式签署《无人物流车采购及长期合作协议》,敲定200台无人物流车采购订单。本次合作,佑驾创新将批量交付无图版小竹T5 Pro车型,这也是真无图无人车面世后斩获的首笔批量订单,标志着其无人物流车业务在商业化落地与区域市场拓展上,迈出了具有里程碑意义的关键一步。
5月19日,腾讯云发布公告称,腾讯云智能体开发平台中提供的 Hy3 preview、DeepSeek-V4-Pro 模型,将于北京时间2026年5月27日10:00起结束限时免费公测,转为正式商用服务,根据模型调用按量计费。付费概述显示,限免结束后,Hy3 preview模型输入价格为0.002元/千tokens,输出价格为0.008元/千tokens,缓存价格为0.0008元/千tokens;DeepSeek-V4-Pro 模型输入价格为0.012元/千tokens,输出价格为0.024元/千tokens,缓存价格为0.001元/千tokens。
5月12日消息,科技媒体Appleinsider昨日(5月11日)发布博文,报道称基于最新公开的3项研究,苹果(AAPL)仍在积极推进空间计算和Vision Pro头显。4 月援引MacRumors媒体报道,苹果(AAPL)公司内部已搁置研发新款Vision Pro,团队重心转向Siri和AI智能眼镜。但从最新公示的研究论文来看,苹果(AAPL)公司并未放弃Vision Pro头显项目,本轮公开了3项研究,分别涉及多模态大模型空间推理评测、美式手语视频标注,以及3D头部重建。其中最直接的一项,是苹果(AAPL)在机器学习博客发布的《From Where Things Are to What They’re For:Benchmarking Spatial-Functional Intelligence for Multimodal LLMs》。这篇论文提出SFI-Bench,用来测试多模态大模型是否既看懂空间布局,也理解物体“能做什么”。原文提到,这套视频基准包含134段室内视频扫描,并整理出1555道专家标注问题。SFI-Bench不只问模型“这是什么、在哪里”,还会追问“它怎么用、出了故障怎么办”。例如,模型可能需要从柜子里找出同品牌数量最多的一组瓶子,理解洗衣机当前程序如何取消,或者判断电视遥控器的用途。相比只测空间识别的旧方法,这更接近日常家庭场景,也更像未来空间助手需要处理的真实任务。
5月7日,银河幸运六狮电玩城与土耳其卫星通信解决方案提供商Profen签署合作意向备忘录。根据合作意向,双方将在卫星研制、新一代卫星通信技术在区域市场的应用探索、以及产品与服务推广等方面深化探索合作机遇,共同推动普惠的卫星通信解决方案在当地的落地与应用。
5月6日消息,制造商Ruko现已在海外推出一款型号为F11PRO 2 Plus的无人机,该机支持8K视频录制,定价为499.99美元(现汇率约合3420元人民币)。该机使用三轴云台稳定系统,搭载4800万像素1/2英寸传感器,可拍摄8K照片和4K 30fps视频,提供6级抗风能力,图传距离20000英尺(约6096米),续航至高37分钟。软件方面,该无人机具备环绕飞行、巡航控制、航点飞行和GPS跟随等功能,支持一键返回、断连自动返回。
4月30日消息,科技媒体MacRumors昨日(4月29日)发布博文,报道称Vision Pro头显在升级M5芯片之后,仍未扭转市场冷淡局面,因此苹果公司内部已搁置研发新款Vision Pro,团队重心转向Siri和AI智能眼镜。这款设备的争议集中在价格与佩戴体验。Vision Pro售价为3499美元,机身重量超过1.3磅。新头带可分散重量,但长时间佩戴仍吃力。报道称,Vision Pro自发布以来热度不足,总销量约60万台。内部消息人士还称,该产品退货比例异常偏高,超过近年其他苹果硬件产品。M5版本未能改善需求,也让后续路线承压。苹果据称已经停止新款Vision Pro相关工作,并把原团队成员分配至其他部门。苹果仍保留关键基础。visionOS(苹果空间计算操作系统)仍由Mike Rockwell监督,即便短期没有硬件改版,系统更新仍会延续。
4月22日消息,谷歌昨日(4月21日)发布博文,宣布升级其自主研究智能体,推出Deep Research与Deep Research Max,均基于Gemini 3.1 Pro模型打造,让智能体从复杂的摘要引擎转变为企业级工作流的基础组件。Deep Research智能体适用于交互式用户场景,平衡优化速度和效率;而Deep Research Max适合异步后台工作流,如生成详尽的尽职调查报告等,追求极致的全面性与最高质量综合,利用扩展的测试时计算进行迭代推理、搜索与精练。
4月10日,智元正式发布Genie Envisioner World Simulator2.0(GE-Sim2.0)。据介绍,GE Sim2.0能够严格响应机器人动作信号,生成高保真的环境变化,并严格遵循物理与语义逻辑。模型支持分钟级长时序稳定推演。多视角视觉、跨视角3D一致性与机器人本体状态(proprioception)被统一建模。内置激励模型(General Reward Model),使模型首次具备自评估能力。随着推理效率的提升,GE2-Sim已经可以接近实时运行,支持Eval in WM、RL in WM、以及Teleoperation in WM都可以直接在模型世界中完成。
3月30日,阿里发布千问新一代全模态大模型Qwen3.5-Omni,在音视频理解、识别、交互等215项任务中取得SOTA(性能最佳),超越Gemini-3.1 Pro,成为目前全球最强的全模态大模型之一。新模型拥有极强的音视频理解与实时交互能力,能够对音视频内容生成详细且可控的结构化描述,可识别语言和方言数量多达113种,还惊喜地涌现出了音视频Vibe Coding能力。目前,阿里云百炼已上新Qwen3.5-Omni的Plus、Flash、Light三种API,可广泛应用于短视频/直播平台、游戏、自媒体等行业。普通用户也可前往Qwen Chat免费体验,开发者和企业可通过阿里云百炼平台调用Qwen3.5-Omni模型,每百万Tokens输入不到0.8元,比Gemini-3.1 Pro的1/10还低。
谷歌旗下 DeepMind 周三更新了专注于音乐领域的人工智能模型Lyria 3 Pro,支持用户创作更长更具结构意识的长音频。这款新模型,可让用户编排歌曲的前奏、主歌、副歌和桥段,以此完成曲目创作。今年2月,谷歌宣布推出Lyria 3。用户可以“描述一个想法”,指定某种风格、情绪或节奏,模型就能自动生成30秒左右歌曲,实现多模态转换和24-bit高音质输出。
3月27日消息,OpenRouter最新周榜数据显示,小米MiMo-V2-Pro模型拿下周榜第一,成为OpenRouter史上首个周token消耗量超3万亿的模型。另据OpenRouter数据,MiMo-V2-Pro在编程领域的市场占有率超30%。截至目前,中国大模型调用量已包揽全球前六。
3月19日消息,小米发布小米大模型Xiaomi MiMo-V2-Pro。据介绍,Xiaomi MiMo-V2-Pro专为现实世界中高强度的Agent工作场景而打造。它拥有超过1T的总参数量(42B激活参数),采用创新的混合注意力架构,并支持1M超长上下文长度。MiMo-V2-Pro模型现已正式开放API服务,支持1M上下文长度,并根据使用量分段计价。256K上下文以内:输入$1/百万tokens,输出$3/百万tokens;1M上下文以内:输入$2/百万tokens,输出$6/百万tokens。MiMo-V2-Pro已在多个平台同步上线。
地理空间情报分析公司觅熵科技(杭州)有限公司(MizarVision)近日宣布完成pre-A轮融资,本轮融资由现象资本独家投资,融资金额超千万元人民币,资金将主要用于业务拓展。觅熵科技成立于2021年,总部位于杭州,是国内首家专注于将商业卫星遥感与AI深度融合,服务实时地理情报的创新企业。公司通过聚合全球多模态实时传感器信息,构建专属的AI情报大模型,对地理空间信息进行深度解读,改变了传统的情报信息的使用方式,让来自太空视角的数据可以更好服务各行业决策。
3月8日消息,欧洲幸运六狮电玩城局(ESA)的两颗 Proba?3 卫星中,有一颗因异常故障失去了姿态控制能力,目前地面已与其失去联系。据了解,欧洲幸运六狮电玩城局(ESA)的 Proba-3 任务于2024年12月从印度发射进入地球轨道。Proba?3由两颗卫星组成,设计目标是以高精度编队飞行,在太空中制造人造日食,以便科学家研究太阳微弱的外层大气 —— 即日冕。但在2月14日发生的一起异常故障导致其中一台探测器失控后,这项任务已陷入危机。事故涉及Proba?3的日冕仪卫星,该卫星负责拍摄太阳日冕图像。与其搭档的掩星卫星会遮挡太阳明亮的盘面,让日冕仪在不受强光干扰的情况下拍摄日冕。为实现这一目标,两颗卫星必须以约150米的间距编队飞行,且保持毫米级的对准精度。任何一台卫星失控,都将直接宣告Proba?3任务失败。Proba?3卫星于2025年 5月进入精确的轨道保持编队,首次实现两颗卫星如此高度同步的飞行能力。随后在2025年6月,该任务成功拍摄到首张人造日食照片。目前,欧空局正在排查上月故障的确切原因。该局在3月6日的最新通报中表示:“异常事件的根本原因仍在调查中,任务团队正全力尝试恢复。”
科技媒体 Cult of Mac 2月3日发布博文,报道称在2026年秋季登场的iPhone 18 Pro和iPhone 18 Pro Max上,苹果公司有望重塑卫星通信体验。使用体验方面,现有iPhone卫星功能主要用于紧急求救,用户必须举起手机对准天空,且仅能发送低速文本,而iPhone 18 Pro系列上,卫星通信将从“备用选项”转变为标准连接协议的一部分。而根据彭博社及行业分析师透露,苹果的目标是实现卫星连接的“自然化”:通过5G非地面网络(NTN)技术,手机将能无缝切换蜂窝与卫星网络。这意味着用户即使将手机放在口袋、汽车仪表盘或身处室内,也能保持连接。同时,苹果地图(Apple Maps)将整合卫星数据,支持无网环境下的精准导航与天气更新。
11月19日,万丰Volocopter垂直起降飞行器VoloXpro获得民航华东地区管理局颁发的民用航空器特许飞行证。VoloXpro为2座、18旋翼eVTOL飞行器,搭载9块可更换锂离子电池,最大飞行速度100千米/小时。该机型自2019年在新加坡完成全球首次公开载人飞行测试以来,已在全球多个国家成功完成多次试飞,将于近期开启国内巡飞之旅。
11月20日消息,苹果公司宣布,搭载M5芯片并配备双环编织头带的Vision Pro现已在韩国和中国台湾开放预购,并将于11月28日星期五在这两个市场正式发售。
11月21日消息,谷歌正式推出全新图像生成与编辑模型 Nano Banana Pro (Gemini 3 Pro Image)。该模型基于 Gemini 3 Pro 架构构建,号称能以“前所未有的控制力、完美的文字渲染效果以及增强的世界知识储备”,将用户的构想转化为“工作室级(studio-quality)”的设计作品。即日起,Nano Banana Pro 面向全球用户开放免费试用。用户只需登录 Gemini 应用,选择“生成图像(Create image)”功能,并切换至“Thinking”模式即可体验这一最新模型。