寒武纪发布第三代云端 AI 芯片思元 370:7nm ,算力高达 256TOPS

【寒武纪发布第三代云端 AI 芯片思元 370:7nm ,算力高达 256TOPS】今天 , 寒武纪发布第三代云端 AI 芯片思元 370、基于思元 370 的两款加速卡 MLU370-S4 和 MLU370-X4、全新升级的 Cambricon Neuware 软件栈 。

寒武纪发布第三代云端 AI 芯片思元 370:7nm ,算力高达 256TOPS

文章插图
据了解 , 基于 7nm 制程工艺 , 思元 370 是寒武纪首款采用 chiplet(芯粒)技术的 AI 芯片 , 集成了 390 亿个晶体管 , 最大算力高达 256TOPS (INT8) , 是寒武纪第二代产品思元 270 算力的 2 倍 。
凭借寒武纪最新智能芯片架构 MLUarch03 , 相较于峰值算力的提升 , 思元 370 实测性能表现更为优秀:以 ResNet-50 为例 , MLU370-S4 加速卡(半高半长)实测性能为同尺寸主流 GPU 的 2 倍;MLU370-X4 加速卡(全高全长)实测性能与同尺寸主流 GPU 相当 , 能效则大幅领先 。
寒武纪发布第三代云端 AI 芯片思元 370:7nm ,算力高达 256TOPS

文章插图
思元 370 也是国内第一颗支持 LPDDR5 内存的云端 AI 芯片 , 内存带宽是上一代产品的 3 倍 , 访存能效达 GDDR6 的 1.5 倍 。