2026年1月22日,在上海举行的「百度文心 Moment」大会现场,舞台灯光聚焦在 DEEPX 创始人兼 CEO 金錄元(Lokwon Kim)身上。这位曾主导 Apple A11 Bionic 芯片研发、在 IBM T.J. Watson 研究中心深耕 AI 处理器的工程师,向现场开发者演示 AI 正在发生的变化——
两块芯片、相同的 AI 负载、各自放置一块黄油。数分钟后,竞品芯片因高功耗迅速升温,黄油完全融化;而 DEEPX 的芯片表面,黄油依然保持原状。“这不是噱头,”Kim在现场说道,“这是 AI 是否能够真正进入物理世界的分水岭。”
依托百度文心飞桨生态,DEEPX 正在将“高性能、低功耗、可规模化”的 Physical AI 从概念变为现实:在仅5瓦功耗条件下,接近 GPU 级别的 OCR 与视觉推理能力,使 AI 得以拥有在真实工业与复杂环境中长期稳定运行的可能性。
从计算重构出发
为 Physical AI 重新定义能效边界
在《贯通数字与物理世界,携手百度将AI芯片之梦变为现实》主题分享中,Kim讲述了 DEEPX 如何携手百度文心飞桨,实现 AI 计算形态从云端向端侧、从“远程智能”走向“物理智能”。他指出,当算力长期依赖高功耗 GPU 与数据中心架构时,AI 天然受限于能耗、散热、成本与网络条件,只能以“远程智能”的形态存在。而 Physical AI 的核心命题,正是让 AI 能够在真实物理环境中长期、稳定、可规模化地运行。
围绕这一目标,DEEPX 的 DX-M1 / DX-M2 系列 NPU 以 5 瓦功耗 作为明确的工程边界,在该能耗水平下实现对大规模 AI 模型的高效推理能力。通过对 AI 计算本质的重构,DEEPX 采用高度聚焦的 NPU 架构,剥离通用计算逻辑,针对 OCR、视觉与推理任务进行算子级与指令级优化,在相同工艺条件下实现显著的能效跃迁。
正如Kim所言:“当芯片的成本与能耗低于人工成本,AI 才真正具备被大规模部署的意义。”
案例落地
基于 PaddleOCR 的端侧文档智能实践
技术能力的价值,最终需要在真实业务场景中得到验证。DEEPX 将百度文心飞桨作为其端侧 AI 规模化落地的重要生态支点。目前,基于双方在 OCR 与文档智能等高价值场景展开的深度合作,DEEPX 首代芯片 DX-M1 已完成量产,并在全球超过 50 个项目中实现落地,覆盖机器人、工业制造、智能家电、国防等多个高要求场景。
在文档智能领域,传统 OCR 与文档解析方案长期面临多重挑战:复杂文字场景下精度不足,边缘或私有化环境中推理效率受限,以及云端部署带来的数据安全与合规压力等问题,是企业在核心业务系统中引入文档智能能力的重要制约因素。
针对上述行业痛点,DEEPX 与百度文心飞桨基于 PP-OCRv5 模型,针对以连续文字为主的企业文档场景进行专项微调,并将模型能力深度适配至其自研 DeepX NPU,共同推出 DocMind 文档智能 SaaS 一体机产品。在5瓦功耗下,实现比300瓦 GPU 更高的 OCR 推理性能,支持中、英、韩等 100+语言文本识别,满足 OCR 相机、微型服务器、无人机等端侧部署需求。
在算法层面,PP-OCRv5 在多语言文字识别、复杂版式鲁棒性与推理效率方面具备成熟能力,为端侧与私有化部署提供稳定可靠的模型基础;在系统层面,DocMind 通过软硬一体化设计,实现文档识别与解析能力的本地化高效部署,避免数据上传云端带来的潜在泄露风险,满足金融、工业及跨国企业对数据安全的刚性需求。
在实际测试中,DX-M1 在关键性能指标上相较主流 GPU(NVIDIA GeForce RTX 2080 Ti)表现出更优的功耗效率与每秒帧数(FPS),尤其在依赖有限电池资源的边缘工业环境中优势明显。结合 PP-OCRv5 的高精度识别能力,该方案在工厂巡检、设备监控、文档处理等场景中,实现了“看得更快、更清、更持久”。
生态共创
构建面向端侧智能的开放技术协同体系
目前,该双方共创产品 DocMind 已作为“首批文心大模型软硬一体共创产品”于「百度文心 Moment」大会正式发布,并荣获星河产业应用创新奖海外创新赛道一等奖。这一“软硬协同”模式,也使 DEEPX 成为全球首家推出“专为 OCR 优化的 NPU 模组”的芯片公司,并因此斩获美国 CES 创新奖。
会上,DEEPX 系统性展示了与百度文心飞桨的多层协同路径:
模型层:实现PaddleOCR、文心大模型与 NPU 架构的深度适配;其第二代芯片DeepX M2将深度集成文心大模型与PaddleOCR-VL能力,将合作延伸至生成式AI前沿;
算法层:共建面向开发者的优化算法与推理能力库;
工具层:结合百度 Comate 等 AI 工具,降低端侧 AI 开发门槛;
演进层:持续探索在 5 瓦功耗条件下运行文心大模型的可行路径,为文心大模型打造定制化的高效硬件底座。
此外,DEEPX 已完成对 PaddleX 系列视觉模型(目标检测、分类、图像分割等)的高效适配验证,验证结果显示,飞桨视觉模型在 DEEPX 低功耗芯片上实现了性能与能效的良好平衡,为行业用户提供可灵活组合的端侧视觉解决方案。
面向未来
Co-Innovate. Co-Deploy. Co-Scale.
在Kim看来,Physical AI 的规模化并非单一技术或单一企业可以独立完成,而是一项需要模型、工具、硬件与应用生态长期协同演进的系统工程。
作为百度飞桨优选级技术伙伴,DEEPX 持续活跃于百度文心飞桨生态活动,共同推动端侧 OCR 与视觉推理方案在真实场景中的验证与落地;同时也在美国 CES 等国际展会上联合展示基于文心飞桨生态的产品及方案,共同开拓全球产业界影响力。
面向未来,双方将进一步围绕文心大模型、PaddleOCR-VL等百度文心飞桨前沿技术成果,探索“识别—理解—生成”全链路文档智能能力在端侧与私有化环境中的实现路径,并在产品共创、联合人才培养及国际市场合作等方面持续深化协同。
从参与 Apple、IBM 的前沿芯片研发,到创立 DEEPX 并投身 Physical AI 基础设施建设,金錄元的选择映射出 AI 产业正在经历的深层转向。当 AI 不再局限于云端,而是具备在真实世界中感知、推理与行动的能力,算力形态、成本结构与能源逻辑都将被重新定义。
正如Kim在演讲中所言,“我们设计的是小芯片,但依托百度文心飞桨生态,它们承载的是让智能真正进入物理世界的可能性。”

{{item.content}}