责任编辑:智企名品(AI机器视觉)
近日,国际计算机体系结构领域顶级会议HPCA 2025(International Symposium on High-Performance Computer Architecture)在美国召开。睿创微纳AI-ISP研发团队与中国科学技术大学联合发表的学术论文成功入围,提出创新性技术路径,赋能红外图像AI-ISP,会议现场获得国际权威专家学者的高度评价。
睿创微纳AI-ISP研发团队与中国科学技术大学联合发表的学术论文题目为《Exploring the Performance Improvement of Tensor Processing Engines through Bit-weight Dimension Transformation in MAC Operations》。研究团队跳出以传统基于乘加器的张量计算架构,首次提出从“位权维度”优化矩阵乘法的全新微架构设计方法及高算力密度的计算架构,在算子底层实现突破性性能提升,为红外ISP中的AI模块带来了显著加速效果。
聚焦底层架构
深挖位权优化潜力
人工智能作为现代技术革命的引擎,其发展根基深植于张量计算体系——尤其是被称为深度学习基石的矩阵乘法运算。当前主流的GPU、NPU等AI加速芯片均将张量处理引擎(Tensor Processing Engine, TPE)作为专用矩阵乘法单元进行集成,但这类硬件模块往往占据芯片30%-50%的晶圆面积及40%以上的动态功耗,成为制约AI算力提升与成本控制的关键瓶颈。
针对这一产业级挑战,睿创微纳AI-ISP研发团队突破传统乘加器(Multiply-Accumulate, MAC)的位权维度约束,首创基于位权解耦的组件化架构设计范式。该技术从位权维度重构了矩阵乘法中的基本运算单元,揭示了更广阔的架构设计空间。特别值得关注的是,团队开发的张量计算微架构已有效适配红外图像增强算法,为低成本、高算力密度的边缘端AI视觉处理开辟了新的技术路径。
多维优化
指标全面提升
研究团队提出了多种优化后的计算架构,在实际测试中展现出了卓越的能效与面积效率表现。与传统基于乘加单元的矩阵乘法单元对比,在28nm制程下,其张量核INT8算力面积效率实现1.56倍提升(达11.29 TOPS/mm²),能效比提升1.49倍(达13.89 TOPS/W)。特别是创新性位稀疏架构,通过稀疏特征编码与红外图像的协同优化,较基准方案面积效率实现2.85倍的提升,为边缘计算场景的高性能AI推理提供了新的硬件范式。
行业赋能
加速红外图像处理
睿创微纳基于该架构研发的AI推理引擎,在红外图像增强算法中取得了显著的加速效果。该AI图像增强算法融合了传统图像增强算法的一些策略,不仅具有极佳的能效、面效表现,且图像细节重建能力显著增强。
▲使用AI超分前
▲使用AI超分后
▲使用AI超分前
▲使用AI超分后
关于HPCA
作为计算机体系结构领域四大顶级会议(HPCA、ISCA、ASPLOS、MICRO)的核心成员,IEEE高性能计算机架构国际研讨会(HPCA)自1995年创办以来始终引领着全球计算硬件的创新方向。
该会议以严苛的学术评审著称,本届会议共收到534篇来自全球顶尖科研机构及高校的论文投稿,最终录用率仅为21%。(近年论文录用率稳定在18%-22%)。会议评审专家大多来自于高通、英特尔、英伟达、IBM、AMD等顶尖研究机构,持续位列CSRankings体系结构类会议前三甲。HPCA聚焦计算架构的范式革新,其技术议程涵盖AI芯片架构、存算一体架构、量子-经典混合计算、超异构处理器等前沿方向。
历届体系结构四大会议曾发布重塑行业格局的里程碑成果,包括Google TPU(ISCA'17首代张量处理器)、华为昇腾910(HPCA'21首个达芬奇架构NPU)、寒武纪MLU(ISCA'16首款商用深度学习ASIC)等标杆性芯片设计。