华为mate60的芯片

发布时间: 2023-10-23 11:41 阅读: 文章来源:1MUMB1485PS

华为公司三十年芯片自研之旅回溯

1991年,华为芯片事业刚起步,由集成电路设计中心负责。

当时,华为面临着芯片成本高、产品利润空间小的困境。首款流片成功的芯片为SD502,用于交换机多功能接口控制。

1993年,华为依托海外采购的EDA软件,成功开发出支持无阻塞时隙交换的SD509,并用于自主研发的第一台数字程控交换机C&C08,该款交换机后成为全球销量最大的交换机之一。

1995年,华为中央研究部成立,下设基础业务部,接手通信系统芯片研发工作。

2004年,华为决定成立海思半导体,以数字安防芯片起家。

2009年,推出一款GSM低端智能手机的一站式解决方案,芯片名为K3V1,开启了手机芯片的漫漫探索之路。

此后,华为2012实验室成立,海思归属实验室管辖,但地位等同于华为一级部门。

经历三十载的辛勤探索,目前,华为共有五大系列芯片。

麒麟芯片为手机SoC芯片,集成应用处理器与基带处理器,广泛应用于华为系列手机上。

计算芯片中,鲲鹏用于高性能计算,昇腾为商用AI芯片。

通信芯片中,巴龙与天罡分别用于基带与基站,正打造5G布局。

联接芯片对应万物互联时代,包括Boudica与凌霄两大品牌。

视频芯片是华为长期发力的方向,安防芯片、机顶盒芯片占据大量市场份额,芯片出货量也达到千万级。

快速崛起的计算芯片双底座:鲲鹏、昇腾

当今数字化时代,万物互联带来数据量的爆发式增长,向IT基础架构的计算能力提出了更高要求。IDC预测,到2023年,全球计算产业投资空间高达1.14万亿美元,中国占比近10%,是全球计算产业发展的重要驱动。

为满足新算力需求,华为围绕“鲲鹏+昇腾”双算力引擎,打造了“算、存、传、管、智”五个子系统的芯片族,实现了计算芯片领域的全面自研。华为是唯一同时拥有“CPU、NPU、存储控制、网络互联、智能管理”5大关键芯片的厂商。我们将重点围绕核心芯片“鲲鹏+昇腾“展开分析。

2023年,何庭波任华为董事、科学家委员会主任、ITMT主任、海思总裁!

(一)计算芯片鲲鹏系列

鲲鹏系列包括服务器和PC机处理器。

早在十余年前,华为开发的嵌入式CPU Hi1380小有所成,成为鲲鹏处理器的开端。

后历经鲲鹏912、916两代产品,最终开发出旗舰产品鲲鹏920与鲲鹏920S,分别用于服务器和PC机。

鲲鹏处理器具备“端边云算力同构”的优势。

其基于ARM V8架构,处理器核、微架构和芯片均由华为自主研发设计。

市场上目前存在超过500万基于ARM指令集的安卓应用,与ARM服务器天然兼容,无需移植即可直接运行,且运行过程中无指令翻译环节,性能无损失,相比X86异构最高能够提升3倍性能。

2019年1月,华为宣布推出业界最高性能ARM架构处理器——鲲鹏920,以及基于鲲鹏920的TaiShan服务器和华为云服务。

鲲鹏920处理器,采用7nm制造工艺。

规格方面,支持64内核,主频可达2.6GHz,集成8通道DDR4,支持PCIe4.0及CCIX接口,可提供640Gbps总带宽。

鲲鹏920主打低功耗、强性能,在典型主频下,SPECint Benchmark评分超过930,超出业界标杆25%;同时,能效比优于业界标杆30%。

之前的记录保持者是富士通的7nm A64X,每个芯片可以达到2.7 teraflops的性能。

除了发布鲲鹏920处理器,华为还推出了三款泰山ThaiShan系列服务器,使用的就是自家的服务器芯片:

包括TaiShan 2280、Thaishan 5280/5290、ThaiShan X6000,

分别面向均衡服务器、存储服务器及高密度服务器市场,具体规格如下:

华为研发高性能ARM服务器处理器已经不是新闻了,之前就有过基于Cortex-A57架构的32核服务器芯片,只不过并没有大规模推广。

此前还有爆料称华为自主研发64核ARM服务器芯片Hi1620,基于7nm工艺。

2019年1月发布的鲲鹏920,就是这款产品Hi620的正式品牌及型号,跟“麒麟”处理器一样,也是使用了中国古代神兽的名字“鲲鹏”!

鲲鹏(Kunpeng )920芯片的架构:

1、Chip:芯片(Chip)是指有大规模集成电路的硅片,我们见过的cPu这种是最常见的芯片。一般几块硅片可以封装在一起组成一个芯片。

2、DIE:芯片的最小物理单元。Kunpeng 920封装了3个DIE,两个用来做计算,第三个用来做IO。

晶粒(die)是以半导体材料制作而成未经封装的一小块集成电路本体,该集成电路的既定功能就是在这一小片半导体上实现。通常情况下,集成电路是以大批方式,经光刻等多项步骤,制作在大片的半导体晶圆,然后再分割成方型小片,这一小片就称为晶粒,每个晶粒就是一个集成电路的复制品。

3、Core:真正的计算单元,我们在操作系统侧看到的“核”。

4、Cluster:若干个核(core)的集合。Kunpeng 920把4个core集合成为一个cluster,而一个DIE上有8个cluster。

5、soc:System on chip,例如,Kunpeng 920除了CPu外,还集成了RoCE 网卡、SAS控制器和南桥。

SoC可以理解为一个芯片集成了一个系统,可以完成特定的一系列的工作,例如,CPU是大脑,SoC是不仅有大脑,还有手、脚、身体等等,这些手脚就相当于,GPU,网卡处理器,声卡处理器等。

1片SoC上包含3个DIE,2个计算DIE,1个IO DIE。

1个计算DIE中8个Cluster。

1个Cluster中4个Core。

因此一个鲲鹏kunpeng 920芯片中包含4*8*2=64个核。

计算DIE上的每一个core具有自己的L1和L2级Cache,所有的core共享L3级Cache。

IO DIE上集成有网络模块、PCle模块。

这些DIE在芯片内部通过高速内部总线进行连接。

计算芯片昇腾系列

在摩尔定律逐渐失效的情况下,AI芯片有助于解决算力问题。昇腾系列是华为全面AI战略的重要支撑。

2018年华为全联接大会上,昇腾310与910同时发布,证实了外界对华为研制AI芯片的猜测。

昇腾310面向边缘场景,高效、灵活、可编程。基于典型配置,八位整数精度(INT8)下的性能达到16TOPS,16位浮点数(FP16)下的性能达到8 TFLOPS,而其功耗仅为8W。

基于已实现量产的昇腾310,华为发布Atlas 200、Atlas 300、Atlas 500、Atlas 800等产品,广泛应用于安防、金融、医疗、交通、电力、汽车等行业。

昇腾910面向训练场景,具有超高算力,其最大功耗为310W,自研的达芬奇架构大大提升了其能效比。

八位整数精度下的性能达到512TOPS,16位浮点数下的性能达到256 TFLOPS。

昇腾910的测试表现远超NVIDIATesla V100和Google TPU v3。

2019年8月,910正式发布,标志着华为AI战略的执行进入新的阶段。

未来,针对不同场景,华为仍将持续推出更多的AI处理器,提供更充裕、更经济、更适配的AI算力。

华为部分在研与规划的AI芯片包括,用于自动驾驶开发的昇腾610、310升级而来的昇腾320以及910升级而来的昇腾920。

介绍一下达芬奇架构:

达芬奇架构本质上是为了适应某个 特定领域 中的常见应用和算法。通常称为 “特定域架构 ”

(Domin Specific Architecture,DSA)。

达芬奇架构包括三种基础计算资源:

矩阵计算单元 (CubeUnit)、

向量计算单元 (Vector Unit) 和 标量计算单元 (Scalar Unit)。

在实际的计算过程中各司其职,形成了三条独立的执行流水线,在系统软件的统一调度下互相配合达到优化的计算效率,并且每一种计算单元都提供了不同精度和不同类型的计算方式。

达芬奇架构包含:scalar,tensor和cube运算,灵活性scalar>tensor>cube,效率 scalar

•••展开全文
相关文章