国产大模型公司MiniMax 6月1日正式发布新一代通用模型MiniMax M3。据介绍,M3采用全新的自研稀疏注意力架构MiniMax Sparse Attention(MSA),在编程及智能体能力、超长上下文及原生多模态等多个关键方向,均实现代际突破。MiniMax披露,在100万上下文规模下,M3单token(词元)计算量仅为上一代模型的约二十分之一,推理效率显著提升。
5月31日,MiniMax Group Inc.在港交所公告,董事会宣布已决议探究拟发行人民币股份的初步建议,可能涉及与专业顾问订立协议及与相关证券或其他监管机构进行咨询及磋商。公司已聘请专业顾问就符合在科创板上市条件提供咨询,并签订辅导协议。拟发行人民币股份事宜将取决于市场状况及必要的监管批准。于公司在香港联交所成功上市后,公司持续评估资本市场,包括对在科创板上市进行评估。
5月28日,MiniMax披露最新业务数据:截至目前,公司服务的全球企业和开发者客户数已超百万,较半年前增长5倍;全球用户规模约3亿。过去两个月,公司年化经常性收入(ARR)实现超过100%的增长。据此前3月业绩会公开信息,公司2026年2月ARR已超1.5亿美元;同期M2系列模型日均token消耗量两个月内增长6倍,开放平台新注册用户增长4倍以上。这次数据披露意味着MiniMax ARR翻番周期已压缩至60天。
5月20日消息,今天凌晨,谷歌I/O 2026开发者大会开幕,谷歌在会上正式发布Gemini 3.5 Flash,并宣布面向全球所有用户开放,可免费使用。Gemini 3.5 Flash在智能水平上已接近大型旗舰模型,同时延续Flash系列高速响应的优势,是谷歌迄今能力最强的智能体与编程模型。据了解,在多项智能体和编码基准测试中,Gemini 3.5 Flash的成绩均超过上一代旗舰模型Gemini 3.1 Pro。具体来看,在Terminal-Bench 2.1测试中,Gemini 3.5 Flash得分达到76.2%,高于Gemini 3.1 Pro的70.3%;GDPval-AA达到1656 Elo;MCP Atlas得分为83.6%,位居全场最高。在多模态理解测试CharXiv Reasoning中,其得分达到84.2%,同样拿下全场最高成绩。除了性能提升,Gemini 3.5 Flash在输出速度上也表现突出,该模型输出速度超过280 token/秒,是GPT-5.5和Claude Opus 4.7的4倍。谷歌表示,凭借速度与性能之间的平衡,Gemini 3.5 Flash非常适合处理长周期智能体任务。过去开发者可能需要数天、审计人员需要数周才能完成的工作,如今在Gemini 3.5 Flash协助下可大幅缩短耗时,且使用成本通常不到其他前沿模型的一半。
5月13日,MiniMax官宣旗下Agent全面升级并新命名为Mavis,同时正式推出Agent Teams多智能体团队协作功能,并整合订阅套餐权益,补齐单智能体复杂任务短板。此次升级两大核心变化,一是桌面端支持Agent Teams,可创建不同角色智能体组队并行工作,协同完成超长、高难度复杂任务;二是合并TokenPlan与Agent Plan订阅体系,一份订阅即可打通CLI、API、Agent全部能力,涵盖M2.7、音乐、视频、语音等所有模型,额度可跨端共享。官方指出,单Agent存在四大明显痛点:复杂任务易中途无故终止、长流程任务容易逻辑跑偏、后台执行任务时无法即时响应用户、单一角色难以适配代码、文档、调研等多类专业分工需求,也是推出多智能体协作的核心原因。
面壁智能联合清华大学、OpenBMB开源社区日前正式发布并开源了新一代端侧多模态大模型MiniCPM-V4.6,以仅1.3B的参数规模,实现了性能与效率的双重突破。尤其在内存价格飞涨的当下,MiniCPM-V4.6只需6G内存即可在端侧流畅运行,实现“低内存、极速跑”。
天眼查App显示,近日,MiniMax关联公司上海稀宇极智科技有限公司发生工商变更,注册资本由10亿人民币增至40亿人民币,增幅300%。 该公司成立于2021年11月,法定代表人为闫俊杰,经营范围包括计算机系统服务、信息系统集成服务、人工智能基础软件开发、人工智能应用软件开发等,由香港稀宇极智有限公司全资持股。
5月9日,MiniMax官微发长文回应M2系列模型无法说出马嘉祺一事,提供了对“嘉祺识别”问题的完整排查过程和技术思考。MiniMax表示,其从分词器版本对齐、embedding统计分布、语义近邻检索、预训练与后训练模型的few-shot对比实验、后训练数据频次统计以及对全词表lm_head变化幅度的排序扫描等多个维度进行了排查。最终定位到的原因是:“嘉祺”在分词器中被合并为一个独立token,但该token在后训练数据中出现频次极低,导致模型在后训练中逐渐遗忘了对该token的生成能力。修复方案方面,MiniMax构造了一份覆盖全词表的合成数据,核心思想是:通过一个简单的复读任务,为全词表建立一个生成频率的“下限保障”,防止任何token因为完全缺失而退化。此外,MiniMax表示,将token覆盖度作为后训练数据质量的一项常规监控指标,可以在早期发现潜在的稀疏token退化风险,避免类似问题在线上复现。
近日,济南智星空间技术有限公司完成超亿元B+轮融资,本轮由中银国际投资领投,中信建投资本和渝富控股旗下中新基金共同参与。本轮融资将用于建设公司新一代智能SAR卫星星座的基线能力,建设公司轻小型无人机载MiniSAR产品产线,并进一步加强公司SAR领域前沿技术的研发力度。
4月22日消息,谷歌昨日(4月21日)发布博文,宣布升级其自主研究智能体,推出Deep Research与Deep Research Max,均基于Gemini 3.1 Pro模型打造,让智能体从复杂的摘要引擎转变为企业级工作流的基础组件。Deep Research智能体适用于交互式用户场景,平衡优化速度和效率;而Deep Research Max适合异步后台工作流,如生成详尽的尽职调查报告等,追求极致的全面性与最高质量综合,利用扩展的测试时计算进行迭代推理、搜索与精练。
4月12日,MiniMax M2.7在全球正式开源,携华为昇腾、摩尔线程、沐曦、昆仑芯、NVIDIA,以及Together AI、Fireworks、Ollama等海内外芯片厂商、推理平台,在开源首日即完成模型接入与推理适配工作。
4月9日,MiniMax宣布发布一个面向AI Agent的命令行工具——MMX-CLI。据MiniMax介绍,接入MMX-CLI后,Agent可以在Claude Code、OpenClaw 等环境中原生调用MiniMax最新的编程、视频生成、语音合成、音乐创作等全模态模型,无需适配繁琐接口,也无需额外编写MCP Server。
谷歌近日对Gemini API的计费档位进行更新,优化方案与定价均基于实际推理使用需求制定。本次新增的推理服务档位包括:标准(Standard)、弹性(Flex)、优先(Priority)、批量(Batch)和缓存(Caching)版。其中,弹性推理档位通过利用非高峰闲置算力资源,提供标准价格五折优惠,目标延迟为1至15分钟,但不提供延迟保证。批量API档位同样提供标准费率五折优惠,延迟最长可达24小时。
3月30日,阿里发布千问新一代全模态大模型Qwen3.5-Omni,在音视频理解、识别、交互等215项任务中取得SOTA(性能最佳),超越Gemini-3.1 Pro,成为目前全球最强的全模态大模型之一。新模型拥有极强的音视频理解与实时交互能力,能够对音视频内容生成详细且可控的结构化描述,可识别语言和方言数量多达113种,还惊喜地涌现出了音视频Vibe Coding能力。目前,阿里云百炼已上新Qwen3.5-Omni的Plus、Flash、Light三种API,可广泛应用于短视频/直播平台、游戏、自媒体等行业。普通用户也可前往Qwen Chat免费体验,开发者和企业可通过阿里云百炼平台调用Qwen3.5-Omni模型,每百万Tokens输入不到0.8元,比Gemini-3.1 Pro的1/10还低。
近日获悉,原华为云中国区副总裁、现华为云新加坡总经理胡维琦将加入MiniMax,知情人士透露,该项人事变动在2026年春节前已达成意向,目前胡维琦正处于入职前的最后准备阶段。有消息称,胡维琦加入MiniMax后将向公司执行董事兼COO贠烨祎直接汇报。
3月18日,MINIMAX-WP(00100.HK)官微发布新一代Agent旗舰大模型M2.7,首次展示“模型自我进化”路径。该模型通过构建Agent Harness体系,深度参与自身训练与优化流程,在部分研发场景中可承担30%~50%的工作流,并在内部评测集上实现约30%的效果提升。据介绍,M2.7能够自行构建复杂Agent Harness,并基于Agent Teams、复杂 Skills、Tool Search tool等能力,完成高度复杂的生产力任务。
近日,AI大模型厂商MiniMax与腾讯云正式达成深度合作,双方围绕Agent RL强化学习训练的核心场景,基于腾讯云Agent Runtime沙箱产品展开全链路技术与业务协同。据了解,此次合作中,双方共同验证了3A infra已经成为Agent时代基础设施发展的核心方向。该标准已在元宝、混元、微信读书等多个头部客户场景完成落地验证。
3月18日,OpenAI推出了GPT-5.4 mini 和 nano,这是其迄今为止功能最强大的小型模型。 GPT-5.4 mini 在编码、推理、多模态理解和工具使用方面都比 GPT-5 mini 有显著改进,同时运行速度也快了两倍以上。GPT-5.4 mini 在包括 SWE-Bench Pro 和 OSWorld-Verified 在内的几项评估中,性能也接近于更大的 GPT-5.4 模型。与此同时,OpenAI表示,GPT-5.4 nano是GPT-5.4系列中体积最小、成本最低的版本,专为速度和成本至关重要的任务而设计。它也是GPT-5 nano的重大升级版。
3月13日,谷歌地图推出“Ask Maps”和“沉浸式导航”两项新功能,均由Gemini模型驱动。Ask Maps:通过对话,直接向地图提出复杂的现实需求并获取定制化的解答,例如“最近的公共厕所在哪里”或者“附近哪个公园适合一家人周末徒步3小时并且可以解决午餐”。沉浸式导航:推出全新3D视图以更好地反映用户周围环境,并提供车道、人行横道、交通信号灯等道路细节。
3月10日,MiniMax强势拉升,报收1220港元/股,涨22.37%,总市值达3826.35亿港元,首次超越百度。 消息面上,近期市场对AI应用关注度急剧升温,随着OpenClaw引爆全球,“龙虾”概念持续发酵,叠加OpenAI等海外巨头技术进展提振板块情绪。MiniMax日前发布的Voice Maker等OpenClaw新技能获得资金热捧,商业化前景被看好,推动股价连续大涨。