英特尔副总裁宋继强:AI计算重心正在向推理转移
专题:新浪财经2025年会暨第18届金麒麟论坛
新浪科技讯 1月15日下午消息 ,“2025科技风云榜”年度盛典于2026年1月15日在北京举办,今年活动主题为“启新智,赴新程 ” ,英特尔公司副总裁、英特尔中国研究院院长宋继强发表《以异构计算推动可信赖的具身智能应用落地》主题演讲 。

宋继强表示,AI能力发展正从基础能力大模型向智能体AI演进,更注重提供具体功能以构建工作流。而具身智能作为物理AI的重要形态 ,将数字世界的智能能力嵌入实体设备与真实世界交互,这类应用多以推理为主。他指出,行业分析机构也预示 ,AI算力需求的重心正从训练向推理转移,这将消耗相应比例的算力 。
宋继强还谈到,多智能体构建完善工作流并实现多流并行运作,从而对异构基础设施提出需求。他解释 ,AI Agent的功能支持包含多种模型 、调度器及预处理模块,这些模块需不同硬件提供更优能效比与成本经济性支撑。尽管所有任务均可在CPU上运行,但难以兼顾及时性与功能有效性 ,因此需高端GPU、中端GPU等多种硬件组合搭配,针对不同规模模型与任务场景实现精准适配 。
宋继强进一步提出,异构系统需在三个层面具备灵活的异构支持能力:上层需构建开放的AI软件栈 ,屏蔽系统级变化以保障应用投资有效性;中间系统基础设施需适配中小企业需求,提供友好的服务器设置配置及以太网互联方案;底层则需整合持续演进的多元硬件,包括不同架构的CPU、GPU 、NPU、AI加速器及类脑计算设备 ,通过分层基础设施构建灵活异构系统。
针对具身智能机器人领域,宋继强分析了多种智能任务实现方式,从传统分层定制模型到全端到端VLA模型 ,目前行业尚未确定更优方案,正处于多元尝试阶段。他指出,传统工业自动控制方案侧重可靠性、实时性与计算精度,而基于大语言模型的方案偏向神经 *** 解决路径 ,需差异化计算架构支撑,可通过CPU实现高速响应 、NPU低功耗输出、GPU完成视觉与语言模型识别,依托CPU+GPU+NPU的异构芯片调度不同工作负载 。
宋继强强调 ,具身智能机器人时代必将到来,也将带来算力和能耗挑战,异构计算正逐渐成为AI基础设施的核心架构。未来当机器人规模达到百万级 ,将突破工业场景限制,广泛承载商业化、个人化应用,亟需多智能体系统支撑。他指出 ,多智能体系统运行于物理AI设备的技术堆栈仍面临诸多挑战,而异构计算是解决系统可信赖问题的关键路径。
新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅 ,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述 。




发表评论