华为详解昇腾AI晶片:自研指令集/架构,全场景最优能耗比

华为详解昇腾AI晶片:自研指令集/架构,全场景最优能耗比

三天前华为在上海全连结2018大会上正式宣布了自家的AI晶片——昇腾310及昇腾910,其中昇腾910是目前单晶片性能最强的AI晶片,FP16半精度性能可达256TFLOPS,比NVIDIA的Tesla

V100还要高一倍,制程工艺也是更先进的7nm。华为昇腾AI晶片是支撑华为AI战略的关键,根据官方所说,昇腾AI晶片使用了自主研发的CISC指令集及达文西架构,能够覆盖从智慧型手机到数据中心在内的多场景,并在每种场景都能提升最好的能效。

华为的AI晶片目前只公布昇腾310及昇腾910,未来还会推出更多,不过这两款晶片中昇腾910是明年才能上市的,需要使用高性能7nm工艺,主打数据中心市场,FP16半精度性能256TFLOPS。相比之下,昇腾310规格没那么高,使用的是12nmFFC工艺,但功耗也低了很多,只有8W,主要适用智慧型手机、智能设备等低功耗产品上。

华为官方日前详细介绍了昇腾310AI晶片的细节,它使用了华为自研的高效灵活CISC指令集,每个AI核心可以在1个周期内完成4096次MAC计算,其架构代号达文西,集成了张量、矢量、标量等多种运算单元,支持多种混合精度计算,支持训练及推理两种场景的数据精度运算。

昇腾310的架构非常灵活,统一架构可以适配多种场景,功耗范围从几十毫瓦到几百瓦,弹性规模增减,并且在每种场景下都能提供最优秀的能耗比。