5月20日消息,今天凌晨,谷歌I/O 2026开发者大会开幕,谷歌在会上正式发布Gemini 3.5 Flash,并宣布面向全球所有用户开放,可免费使用。Gemini 3.5 Flash在智能水平上已接近大型旗舰模型,同时延续Flash系列高速响应的优势,是谷歌迄今能力最强的智能体与编程模型。据了解,在多项智能体和编码基准测试中,Gemini 3.5 Flash的成绩均超过上一代旗舰模型Gemini 3.1 Pro。具体来看,在Terminal-Bench 2.1测试中,Gemini 3.5 Flash得分达到76.2%,高于Gemini 3.1 Pro的70.3%;GDPval-AA达到1656 Elo;MCP Atlas得分为83.6%,位居全场最高。在多模态理解测试CharXiv Reasoning中,其得分达到84.2%,同样拿下全场最高成绩。除了性能提升,Gemini 3.5 Flash在输出速度上也表现突出,该模型输出速度超过280 token/秒,是GPT-5.5和Claude Opus 4.7的4倍。谷歌表示,凭借速度与性能之间的平衡,Gemini 3.5 Flash非常适合处理长周期智能体任务。过去开发者可能需要数天、审计人员需要数周才能完成的工作,如今在Gemini 3.5 Flash协助下可大幅缩短耗时,且使用成本通常不到其他前沿模型的一半。
4月22日消息,谷歌昨日(4月21日)发布博文,宣布升级其自主研究智能体,推出Deep Research与Deep Research Max,均基于Gemini 3.1 Pro模型打造,让智能体从复杂的摘要引擎转变为企业级工作流的基础组件。Deep Research智能体适用于交互式用户场景,平衡优化速度和效率;而Deep Research Max适合异步后台工作流,如生成详尽的尽职调查报告等,追求极致的全面性与最高质量综合,利用扩展的测试时计算进行迭代推理、搜索与精练。
谷歌近日对Gemini API的计费档位进行更新,优化方案与定价均基于实际推理使用需求制定。本次新增的推理服务档位包括:标准(Standard)、弹性(Flex)、优先(Priority)、批量(Batch)和缓存(Caching)版。其中,弹性推理档位通过利用非高峰闲置算力资源,提供标准价格五折优惠,目标延迟为1至15分钟,但不提供延迟保证。批量API档位同样提供标准费率五折优惠,延迟最长可达24小时。
3月30日,阿里发布千问新一代全模态大模型Qwen3.5-Omni,在音视频理解、识别、交互等215项任务中取得SOTA(性能最佳),超越Gemini-3.1 Pro,成为目前全球最强的全模态大模型之一。新模型拥有极强的音视频理解与实时交互能力,能够对音视频内容生成详细且可控的结构化描述,可识别语言和方言数量多达113种,还惊喜地涌现出了音视频Vibe Coding能力。目前,阿里云百炼已上新Qwen3.5-Omni的Plus、Flash、Light三种API,可广泛应用于短视频/直播平台、游戏、自媒体等行业。普通用户也可前往Qwen Chat免费体验,开发者和企业可通过阿里云百炼平台调用Qwen3.5-Omni模型,每百万Tokens输入不到0.8元,比Gemini-3.1 Pro的1/10还低。
3月13日,谷歌地图推出“Ask Maps”和“沉浸式导航”两项新功能,均由Gemini模型驱动。Ask Maps:通过对话,直接向地图提出复杂的现实需求并获取定制化的解答,例如“最近的公共厕所在哪里”或者“附近哪个公园适合一家人周末徒步3小时并且可以解决午餐”。沉浸式导航:推出全新3D视图以更好地反映用户周围环境,并提供车道、人行横道、交通信号灯等道路细节。
3月4日,谷歌推出Gemini 3.1 Flash-Lite模型。谷歌称,3.1 Flash Lite定价为每100万个输入令牌0.25美元,每100万个输出令牌1.50美元,即日起,3.1 Flash-Lite将通过Gemini API在Google AI Studio中面向开发者推出预览版,并通过Vertex AI面向企业客户推出。
3月3日,乐奇Rokid旗下Al眼镜RokidGlasses海外版宣布升级,正式接入谷歌Gemini、ChatGPT,、DeepSeek及阿里通义千问四大主流Al大模型,乐奇Rokid也因此成为行业首款支持Gemini的Al眼镜,可在端云协同架构下,实现跨模型自由切换,多模态交互与实时翻译等功能。
2月16日,阿里巴巴开源全新一代大模型千问Qwen3.5-Plus,性能媲美Gemini 3 Pro,登顶全球最强开源模型。千问3.5实现了底层模型架构的全面革新,此次发布的Qwen3.5-Plus版本总参数为3970亿,激活仅170亿,以小胜大,性能超过万亿参数的Qwen3-Max模型,部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。Qwen3.5-Plus的API价格每百万Token低至0.8元,仅为Gemini 3 pro的1/18。 ?
2月12日消息,谷歌正在新增一种功能,让消费者在搜索引擎和其Gemini聊天机器人中获取人工智能驱动的答案时,可以直接购买商品。这是其整体计划的一部分,旨在更直接地从用户使用人工智能的过程中实现变现。该公司在周三致广告圈的信函中表示,其谷歌搜索的AI模式正在测试新型广告格式,允许零售商及其他广告商在此展示商品。谷歌表示,用户现可在Gemini内直接购买Etsy和Wayfair的商品。AI模式新增的“Direct Offers”功能将允许品牌向潜在购物者提供折扣。
11月26日,空间推理基准测试SpatialBench更新了最新一期榜单,阿里千问的视觉理解模型Qwen3-VL、Qwen2.5-VL位列头两名,超越Gemini 3、GPT-5.1、Claude Sonnet4.5等国际顶尖模型。据了解,SpatialBench是一项近年来兴起的第三方空间推理基准测试榜单,主要聚焦多模态模型在空间、结构、路径等方面的综合推理能力,被AI社区视为是衡量“具身智能”进展的新兴测试标准之一。SpatialBench不仅测试模型已知的知识,还测试模型在二维和三维空间中“感知”和操控抽象概念的能力,这对具身智能的落地尤为关键。
随着搜索引擎巨头谷歌加紧步伐以跟上ChatGPT开发商OpenAI的节奏,该公司正式推出了最新人工智能模型Gemini 3。谷歌母公司Alphabet首席执行官孙达尔?皮查伊(Sundar Pichai)在谷歌周二发布的多篇博客文章中表示,这款新的人工智能模型能让用户在解答更复杂问题时获得更优答案,“无需过多提示词,就能得到你需要的结果”。
10月22日,除了发布其首款XR头显外,三星还宣布了其即将推出AI眼镜的计划。这家韩国科技巨头已确认,未来将推出由人工智能驱动的智能眼镜,并正在与谷歌以及知名时尚眼镜品牌合作开发此类可穿戴设备。目前,三星尚未公布其AI眼镜的具体名称,但透露该产品将基于Android XR系统实现无缝连接体验。此前有报道称,三星计划于2026年推出首款无显示功能的AI眼镜,并在2027年发布配备增强现实(AR)显示屏的版本。
当地时间周三,谷歌律师约翰·施密特林在美国联邦法院听证会上向法官阿米特·梅塔向法院表示,希望继续捆绑热门地图和视频应用与Gemini AI服务,以回应美国司法部此前提出的禁止提议。施密特林强调,“目前没有任何迹象表明谷歌在人工智能市场已获得垄断地位或市场力量”,同时指出法院并未认定谷歌地图或YouTube构成垄断产品。
9月4日,据媒体报道,苹果公司已于本周和谷歌达成新的协议,开始评估谷歌开发的Gemini AI模型,而且已不再考虑收购Perplexity。消息称苹果公司目前正在测试多种AI方案,除了自家研发的模型之外,还积极探索整合OpenAI、Anthropic、谷歌的技术。媒体透露苹果目前尚未最终确定使用哪家技术,但谷歌Gemini已成为重点考察对象,这一进展标志着双方在AI领域的合作进入实质性测试阶段。消息源还透露由于稳固和谷歌的合作关系,苹果已不再考虑收购专注于AI搜索的Perplexity公司。
当地时间8月26日,谷歌正式推出了其最先进的图像生成与编辑模型Gemini 2.5 Flash Image,代号“纳米香蕉”(nano banana)。该模型当前在LMArena基准测试中位列AI图像编辑模型榜首,具备角色一致性保持、自然语言精准修图、多图融合能力,并利用Gemini世界知识提升智能表现。目前用户可通过Gemini App、API等方式访问,其API定价为每百万输出token30美元。
当地时间5月6日,谷歌DeepMind人工智能研究团队发布了Gemini 2.5 Pro “I/O” ,这是今年3月发布的多模态大语言模型Gemini 2.5 Pro的升级版本。在AI排行榜LMArena上,该模型在多个指标上登顶。目前该模型已向Google AI Studio的独立开发者、Vertex AI云平台的企业用户以及Gemini应用的普通用户开放。
2月7日,据研究公司 SimilarWeb估计,在短短一周内,DeepSeek网站的用户数量就超过了谷歌的 Gemini 聊天AI(后者已经存在了近两年)。1月31日,DeepSeek.com在美国的日访问量为240万次,比Gemini网站(150万次)高出 60%。OpenAI 的ChatGPT仍然是其八倍,当天的日访问量为1930万次。(DeepSeek 在1月28日的访问量达到490万次的峰值。)DeepSeek和Gemini之间的差距在美国以外更大:SimilarWeb的数据显示,1月31日,这个中国聊天AI在全球(基本不包括中国)的访问量为2920万次,是Gemini的三倍多。
2月6日消息,谷歌周三向所有人发布了 Gemini 2.0——号称迄今为止功能最强大的人工智能模型套件。去年 12 月,该公司向开发人员和受信任的测试人员开放了访问权限,并将一些功能整合到谷歌产品中,但谷歌表示,这是一次全面发布。该模型套件包括 2.0 Flash,被称为主力模型,最适合大规模高容量、高频率任务,以及 2.0 Pro Experimental 用于编码性能,以及 2.0 Flash-Lite,该公司称其为迄今为止最具成本效益的模型。
当地时间12月11日,谷歌宣布推出最新AI模型Gemini 2.0,称这是其迄今为止最强大的模型。即日起,谷歌将2.0开放给开发者以及受信任的测试人员,并正在积极推进将其整合到公司的产品中,率先从Gemini和Search开始。即日起,Gemini 2.0 Flash体验版模型将对所有Gemini用户开放。同时,谷歌还推出了Deep Research的新功能,它运用高级推理和长上下文处理能力,承担研究助手的角色,帮助用户探索复杂的主题并撰写报告。该功能自即日起对Gemini Advanced用户开放。
当地时间2月21日,谷歌在社交平台X上发布声明称,该公司意识到其Gemini人工智能产品在一些历史图像生成描述中存在不准确之处,其正在努力改善这一问题。谷歌表示,“我们意识到Gemini在某些历史图像生成描述中存在不准确之处。Gemini的AI图像生成功能的确可以生成各类的人。这通常是件好事,因为世界各地的人们都在使用它。但它在这里失误了。”