10月12日上午,在全球合作伙伴大会算力网络联合创新分论坛上,“中央企业算力网络创新联合体十大成果”正式发布,中国移动“芯易”存算一体通用软件计算引擎成功入选“中央企业算力网络创新联合体十大成果”并在论坛发布。
存算一体技术通过器件、计算范式、架构等方面的革新,大幅提升算力和能效水平,同时降低对先进工艺的依赖,为提升我国先进算力自主可控提供了一条可选路径。中国移动聚焦存算一体软件生态薄弱痛点,自主研发“芯易”存算一体通用软件计算引擎,联合清华大学、后摩智能、知存科技完成RRAM、SRAM、NOR-Flash三大技术路线芯片的兼容适配,无缝对接Pytorch和TensorFlow 主流AI框架,引领产业加速构建存算一体软件生态。
在AI时代全球算力需求呈爆炸式增长的背景下,存算一体技术突破冯·诺依曼架构瓶颈,为AI计算提供高性能、低成本的算力解决方案。当前存算一体多技术路线并行发展,存算一体软件存在软硬件强耦合及“孤岛式”开发问题,导致软件生态薄弱,同时AI模型与存算一体芯片适配难度大,面临集成规模受限、计算效率饱和、精度鲁棒性低、模型编排复杂等问题,加上应用牵引不足,最终阻碍了存算一体技术的应用推广。
针对上述问题,中国移动自主研发“芯易”通用存算一体软件计算引擎,创新提出了面向存算一体架构的模型裁剪量化、模型推理优化、协同精度优化、权重智能编排等优化算法,软硬协同发挥芯片性能,并在智能推荐、端侧大模型、巡检等场景率先完成应用验证,加速存算一体技术成熟。
在架构创新方面,中国移动提出面向异构存算一体芯片的通用计算架构,向上兼容Pytorch、Tensorflow通用AI框架,向下适配RRAM、SRAM、FLASH三种主流技术路线的存算一体芯片,研发编译器、运行时、优化器等核心组件,为存算一体芯片提供模型编排、部署、优化、推理等全流程服务,极大降低模型部署、应用、迁移的门槛,推动产业生态发展。
“芯易”EasyCIM存算一体通用软件计算引擎架构图
在算法创新方面,针对存算一体阵列集成规模受限、器件支持位宽低的问题,提出一种面向存算一体架构的模型裁剪量化算法,基于剪枝、量化和局部残差策略,将语义分割网络参数从近2800万个精简至不超过50万个,近一半模型参数使用超低比特表示,大幅降低模型尺寸与计算量。
面向存算一体架构的模型裁剪量化算法结构及结果
针对存算一体计算效率饱和、模型适配难的问题,提出一种面向存算一体芯片的模型推理优化算法,通过引入多分支参数结构、利用大卷积核替代级联小卷积核并结合结构重参数化策略,提升AI模型与存算一体芯片的适配度,优化后的ResNet50网络在存算一体芯片的推理速率提升40%、精度提升1.5%。
面向存算一体架构的模型推理优化算法结构及结果
针对存算一体器件、电路非理想特性导致精度鲁棒性低的问题,提出一种面向存算一体芯片的AI模型协同精度优化方法,在模型训练阶段引入存算一体芯片上的推理结果进行反向传播并更新模型权重,基于该方法优化的图像识别算法准确率提升10%。
面向存算一体架构的模型协同精度优化算法框架及结果
针对存算一体芯片模型编排复杂度高、阵列利用率低的问题,提出一种面向存算一体架构的模型权重智能编排算法,基于序列到序列的指针网络生成AI模型分层排序,编排效率相比传统人工蜂群算法(ABC)提升10倍以上。
面向存算一体架构的模型权重智能编排算法结构及结果
在应用创新方面,中国移动基于“芯易”存算一体通用软件计算引擎实现了智能推荐、端侧大模型、巡检机器人等一系列存算一体创新应用,牵引应用落地。
在RRAM方面,中国移动联合清华大学将RRAM存算一体向量检索芯片应用到智能视频推荐场景,基于存算一体软件计算引擎实现视频向量在VD200 RRAM存算一体向量检索芯片的部署和查询,支持百万级向量部署和检索,视频推荐召回服务吞吐率达2万次/秒,检索性能达到传统服务器4倍。
基于RRAM存算一体芯片的视频推荐应用
在SRAM方面,中国移动联合后摩智能将存算一体芯片应用到大模型端侧推理场景,基于“芯易”存算一体软件计算引擎实现ChatGLM-6B、Qwen-7B、LLAMA2-7B大语言模型在M30 SRAM存算一体芯片上的优化推理,推理速度达15Tokens/s,相比传统架构计算芯片token生成速度提升1倍、计算能效提升50%。
基于SRAM存算一体芯片的端侧大模型推理应用
在NOR-FLASH方面,中国移动联合知存科技将存算一体芯片应用到智能巡检机器人场景,基于“芯易”存算一体软件计算引擎实现轻量化语音AI模型在WTM2101 NOR-FLASH存算一体芯片的协同精度优化和自动化编排,支持语音控制机器人启停、移动、转向,提升巡检机器人作业效率50%以上。
基于NOR-Flash存算一体芯片的巡检机器人应用
中国移动存算一体团队深耕技术创新,依托自主研发的"“芯易"”存算一体通用软件引擎及核心算法,已形成显著学术与产业影响力,在《IEEE/CAA Journal of Automatica Sinica》(IF=11.8)《IEEE Transactions on Mobile Computing》(IF=9.2)等国际顶级期刊,以及ISCA、UbiComp、EMNLP等国际顶级会议发表论文10余篇;累计申请发明专利70余项、软著10余项。相关成果先后入选2024论坛重大科技成果、2023年“科创中国”先导技术榜、2023年世界互联网大会领先科技成果,并斩获2024数字中国创新大赛智能科技赛道一等奖、2024年第二届全国先进计算技术创新大赛二等奖,获得业界高度认可。与此同时,团队积极联动产业生态,联合后摩智能、知存科技等存算一体芯片厂商,在先进计算产业发展联盟牵头推进存算一体通用软件工具链研究,于2024年11月联盟第二届全体会议上完成《存算一体软件工具链研究报告》结项及成果发布,为存算一体软件架构与接口标准化建设注入关键推力。
未来,中国移动将持续攻关存算一体软硬件协同技术,拓展基于存算一体的创新应用场景,积极推进存算一体软件标准建设,持续引领产业加速构建存算一体软件生态。
还没有评论,来说两句吧...