华为mate60的芯片

发布时间: 2023-10-23 11:41 阅读: 文章来源:1MUMB1485PS

华为公司三十年芯片自研之旅回溯

1991年,华为芯片事业刚起步,由集成电路设计中心负责。

当时,华为面临着芯片成本高、产品利润空间小的困境。首款流片成功的芯片为SD502,用于交换机多功能接口控制。

1993年,华为依托海外采购的EDA软件,成功开发出支持无阻塞时隙交换的SD509,并用于自主研发的第一台数字程控交换机C&C08,该款交换机后成为全球销量最大的交换机之一。

1995年,华为中央研究部成立,下设基础业务部,接手通信系统芯片研发工作。

2004年,华为决定成立海思半导体,以数字安防芯片起家。

2009年,推出一款GSM低端智能手机的一站式解决方案,芯片名为K3V1,开启了手机芯片的漫漫探索之路。

此后,华为2012实验室成立,海思归属实验室管辖,但地位等同于华为一级部门。

经历三十载的辛勤探索,目前,华为共有五大系列芯片。

麒麟芯片为手机SoC芯片,集成应用处理器与基带处理器,广泛应用于华为系列手机上。

计算芯片中,鲲鹏用于高性能计算,昇腾为商用AI芯片。

通信芯片中,巴龙与天罡分别用于基带与基站,正打造5G布局。

联接芯片对应万物互联时代,包括Boudica与凌霄两大品牌。

视频芯片是华为长期发力的方向,安防芯片、机顶盒芯片占据大量市场份额,芯片出货量也达到千万级。

快速崛起的计算芯片双底座:鲲鹏、昇腾

当今数字化时代,万物互联带来数据量的爆发式增长,向IT基础架构的计算能力提出了更高要求。IDC预测,到2023年,全球计算产业投资空间高达1.14万亿美元,中国占比近10%,是全球计算产业发展的重要驱动。

为满足新算力需求,华为围绕“鲲鹏+昇腾”双算力引擎,打造了“算、存、传、管、智”五个子系统的芯片族,实现了计算芯片领域的全面自研。华为是唯一同时拥有“CPU、NPU、存储控制、网络互联、智能管理”5大关键芯片的厂商。我们将重点围绕核心芯片“鲲鹏+昇腾“展开分析。

2023年,何庭波任华为董事、科学家委员会主任、ITMT主任、海思总裁!

(一)计算芯片鲲鹏系列

鲲鹏系列包括服务器和PC机处理器。

早在十余年前,华为开发的嵌入式CPU Hi1380小有所成,成为鲲鹏处理器的开端。

后历经鲲鹏912、916两代产品,最终开发出旗舰产品鲲鹏920与鲲鹏920S,分别用于服务器和PC机。

鲲鹏处理器具备“端边云算力同构”的优势。

其基于ARM V8架构,处理器核、微架构和芯片均由华为自主研发设计。

市场上目前存在超过500万基于ARM指令集的安卓应用,与ARM服务器天然兼容,无需移植即可直接运行,且运行过程中无指令翻译环节,性能无损失,相比X86异构最高能够提升3倍性能。

2019年1月,华为宣布推出业界最高性能ARM架构处理器——鲲鹏920,以及基于鲲鹏920的TaiShan服务器和华为云服务。

鲲鹏920处理器,采用7nm制造工艺。

规格方面,支持64内核,主频可达2.6GHz,集成8通道DDR4,支持PCIe4.0及CCIX接口,可提供640Gbps总带宽。

鲲鹏920主打低功耗、强性能,在典型主频下,SPECint Benchmark评分超过930,超出业界标杆25%;同时,能效比优于业界标杆30%。

之前的记录保持者是富士通的7nm A64X,每个芯片可以达到2.7 teraflops的性能。

除了发布鲲鹏920处理器,华为还推出了三款泰山ThaiShan系列服务器,使用的就是自家的服务器芯片:

包括TaiShan 2280、Thaishan 5280/5290、ThaiShan X6000,

分别面向均衡服务器、存储服务器及高密度服务器市场,具体规格如下:

华为研发高性能ARM服务器处理器已经不是新闻了,之前就有过基于Cortex-A57架构的32核服务器芯片,只不过并没有大规模推广。

此前还有爆料称华为自主研发64核ARM服务器芯片Hi1620,基于7nm工艺。

2019年1月发布的鲲鹏920,就是这款产品Hi620的正式品牌及型号,跟“麒麟”处理器一样,也是使用了中国古代神兽的名字“鲲鹏”!

鲲鹏(Kunpeng )920芯片的架构:

1、Chip:芯片(Chip)是指有大规模集成电路的硅片,我们见过的cPu这种是最常见的芯片。一般几块硅片可以封装在一起组成一个芯片。

2、DIE:芯片的最小物理单元。Kunpeng 920封装了3个DIE,两个用来做计算,第三个用来做IO。

晶粒(die)是以半导体材料制作而成未经封装的一小块集成电路本体,该集成电路的既定功能就是在这一小片半导体上实现。通常情况下,集成电路是以大批方式,经光刻等多项步骤,制作在大片的半导体晶圆,然后再分割成方型小片,这一小片就称为晶粒,每个晶粒就是一个集成电路的复制品。

3、Core:真正的计算单元,我们在操作系统侧看到的“核”。

4、Cluster:若干个核(core)的集合。Kunpeng 920把4个core集合成为一个cluster,而一个DIE上有8个cluster。

5、soc:System on chip,例如,Kunpeng 920除了CPu外,还集成了RoCE 网卡、SAS控制器和南桥。

SoC可以理解为一个芯片集成了一个系统,可以完成特定的一系列的工作,例如,CPU是大脑,SoC是不仅有大脑,还有手、脚、身体等等,这些手脚就相当于,GPU,网卡处理器,声卡处理器等。

1片SoC上包含3个DIE,2个计算DIE,1个IO DIE。

1个计算DIE中8个Cluster。

1个Cluster中4个Core。

因此一个鲲鹏kunpeng 920芯片中包含4*8*2=64个核。

计算DIE上的每一个core具有自己的L1和L2级Cache,所有的core共享L3级Cache。

IO DIE上集成有网络模块、PCle模块。

这些DIE在芯片内部通过高速内部总线进行连接。

计算芯片昇腾系列

在摩尔定律逐渐失效的情况下,AI芯片有助于解决算力问题。昇腾系列是华为全面AI战略的重要支撑。

2018年华为全联接大会上,昇腾310与910同时发布,证实了外界对华为研制AI芯片的猜测。

昇腾310面向边缘场景,高效、灵活、可编程。基于典型配置,八位整数精度(INT8)下的性能达到16TOPS,16位浮点数(FP16)下的性能达到8 TFLOPS,而其功耗仅为8W。

基于已实现量产的昇腾310,华为发布Atlas 200、Atlas 300、Atlas 500、Atlas 800等产品,广泛应用于安防、金融、医疗、交通、电力、汽车等行业。

昇腾910面向训练场景,具有超高算力,其最大功耗为310W,自研的达芬奇架构大大提升了其能效比。

八位整数精度下的性能达到512TOPS,16位浮点数下的性能达到256 TFLOPS。

昇腾910的测试表现远超NVIDIATesla V100和Google TPU v3。

2019年8月,910正式发布,标志着华为AI战略的执行进入新的阶段。

未来,针对不同场景,华为仍将持续推出更多的AI处理器,提供更充裕、更经济、更适配的AI算力。

华为部分在研与规划的AI芯片包括,用于自动驾驶开发的昇腾610、310升级而来的昇腾320以及910升级而来的昇腾920。

介绍一下达芬奇架构:

达芬奇架构本质上是为了适应某个 特定领域 中的常见应用和算法。通常称为 “特定域架构 ”

(Domin Specific Architecture,DSA)。

达芬奇架构包括三种基础计算资源:

矩阵计算单元 (CubeUnit)、

向量计算单元 (Vector Unit) 和 标量计算单元 (Scalar Unit)。

在实际的计算过程中各司其职,形成了三条独立的执行流水线,在系统软件的统一调度下互相配合达到优化的计算效率,并且每一种计算单元都提供了不同精度和不同类型的计算方式。

达芬奇架构包含:scalar,tensor和cube运算,灵活性scalar>tensor>cube,效率 scalar

标量计算单元 (Scalar Unit):

类似一个MCU,可以是ARM的,也可以是RISC-V,用于标量计算、逻辑判断、控制调度等;

向量计算单元 (Vector Unit):

类似一个DSP,用于矢量、向量计算,AI CPU即为向量计算单元;

矩阵计算单元 (CubeUnit):

类似谷歌TPU脉动阵列结构,是一个乘累加阵列,用于矩阵、卷积、张量计算,AI Core即为矩阵计算单元,适合计算密集型算子。

华为达芬奇核心分为三种,最完整的是“Max”,其次是Lite,再次是Tiny,Max可在一个周期内完成8192次MAC运算,Tiny仅512次。

整体来看,两个bufferL0A和L0B作为输入,其中一个暂存activition,另一个暂存权重。

红色的Cube模块,计算结果输出存放在另外一个buffer L0C。

Vector Unit,从buffer L0C中取得乘累加计算结果,然后进行pooling/padding,BN,激活,加法等处理。

如果还没得到最终结果,就暂时返回存储在buffer L0C,如果得到了最终结果,就传递给Unified Buffer。

昇腾AI处理器的计算核心主要由 AI Core 构成,包含三种基础计算资源:矩阵计算单元(Cube Unit)、向量计算单元(Vector Unit)和标量计算单元(Scalar Unit),负责执行张量、矢量、标量计算。

其中向量是数学上的叫法,矢量则是物理上的叫法。

AI Core 中的矩阵计算单元支持 Int8 和 fp16 的计算,向量计算单元支持 fp16 和 fp32 的计算。

AI Core 基本结构如下:

(二)麒麟手机SoC(System-on-a-Chip)

芯片由应用处理器(AP)与基带处理器(BP)组成。

其中,AP包括CPU(中央处理器)、GPU(图形处理器)、ISP(图像处理器)等,负责操作系统、用户界面和应用程序处理;

BP包括基带和射频部分,负责通信信号处理。

近年来,各大芯片厂商开始研发SoC芯片,提供整体解决方案,华为海思也积极布局。从技术上来看,SoC芯片研发的难点在于各个组成部分的集成与协同。

华为起步于一款算不上成功的产品——K3V1。

2006年,成立两年的海思受联发科启发,开始研究手机芯片,三年后推出第一款应用处理器,即K3V1,但由于110nm工艺远落后于当时的主流方案,且对应Windows Phone系统,最终未能上市。

2012年,K3V2发布,工艺仍相对落后且发热较严重,但性能差距在缩小,搭载于华为D、P和Mate系列上,激励着芯片技术的提升。

转机最终出现于2013年,海思推出第一款手机SoC芯片——麒麟910,是全球首款四核SoC芯片,采用当时主流的28nm工艺,匹配Mali 450MP4 GPU,集成自研巴龙710基带,应用于华为P6s。此次崭露头角为更大的成功奠定了基础。

此后,麒麟920、925、928、930、935、950、960、970、980以及面向中端手机的620、650、710、810等先后发布,制程工艺不断升级,实现了由追赶到并排,再到领跑的转变。

其中,麒麟925应用于华为Mate7上,全球销量超700万部;

麒麟620先后应用于中端的荣耀4X、4C上,荣耀4X销量破千万;

麒麟930标志着手机芯片进入64位时代;

麒麟950、970、980分别在全球率先商用16nm、10nm和7nm工艺;

麒麟970还首次在SoC芯片中集成人工智能计算平台NPU,开创端侧AI先河,搭载该芯片的Mate 10出货量累计达1000万台。

2019 年 9 月,华为一代旗舰芯片麒麟 990 系列推出,包括麒麟 990 和麒麟990 5G 两款芯片。

采用 7nm+工艺 ,其中前者采用7nm工艺,后者采用7nm+工艺。

其中,麒麟990 5G是全球首款旗舰5G SoC芯片,首次将5G Modem集成到SoC芯片中,率先支持NSA/SA双架构和TDD/FDD全频段,是业界首个全网通5G SoC。

基于巴龙5000的5G联接,麒麟990 5G实现了2.3Gbps的5G峰值下载速率,5G上行峰值速率达1.25Gbps。

(三)5G通信设备制霸的核心芯片:巴龙、天罡

布局一:巴龙系列基带芯片

基带芯片用来合成即将发射的基带信号,对接收到的基带信号进行解码。

2007年开始,华为布局基带芯片研发,原因是华为当时的热门产品数据卡的基带芯片依赖于高通,常常断货。

2010年,华为推出首款TD-LTE基带芯片——巴龙700,打破高通的垄断。

2014年,在麒麟910上,华为第一次将基带芯片和AP集成在一块SoC上。

目前,巴龙4G系列套片全球累计发货过亿,有完整的产品组合,能力从Cat 4到Cat 19,对应单连接速率从150Mbps到1.6Gbps不等。

2018年2月,华为发布巴龙5G01基带芯片,是第一款商用的、基于3GPP标准的5G芯片,但体积较大;此前,高通曾发布业界首款5G调制解调器骁龙X50,但并非基于3GPP标准,且仅支持5G网络而不兼容前代网络。

2019年1月,华为发布巴龙5000。其体积小、集成度高,支持5G及前代网络制式。

巴龙5000率先实现了业界标杆的5G峰值下载速率,在Sub-6GHz(低频频段,5G的主用频段)频段实现4.6Gbps,在毫米波(高频频段,5G的扩展频段)频段达6.5Gbps,是4G LTE可体验速率的10倍。

华为表示,巴龙5000除用于智能手机外,还可以在家庭宽带终端、车载终端等场景下使用。

布局二:天罡系列基站芯片

天罡是业界首款5G基站核心芯片,在集成度、算力、频谱带宽等方面取得了突破性进展。天罡首次在极低的天面尺寸规格下, 支持大规模集成有源功放和无源阵子;实现2.5倍运算能力的提升,搭载最新的算法及波束赋形,单芯片可控制高达64路通道;极宽频谱,支持200M运营商频谱带宽。天罡芯片为有源天线处理单元带来了革命性的提升,实现基站尺寸缩小超50%,重量减轻23%,功耗节省达21%,安装时间比标准的4G基站节省一半。

(四)为物联网而生的链接芯片:Boudica、凌霄

布局一:Boudica系列NB-IOT芯片

NB-IoT(NarrowBand Internet of Things,窄带物联网)聚焦低功耗、广覆盖物联网(IoT)市场,可在智能停车、智慧农业、远程抄表等垂直行业广泛应用,具有低功耗、连接稳定、成本低、架构优化出色等特点。近年来,工信部以及三大运营商均在不同程度上予以扶持。但受限于技术因素,NB-IoT发展仍较为缓慢,其中终端芯片是核心难点之一。

华为2014年开始进行NB-IoT芯片研发。

2015年,推出基于预标准的芯片原型产品。

2016年9月,发布业界首款商用NB-IoT芯片Boudica 120。

此后,又推出支持3GPPR14的完全成熟的Boudica 150,可实现更低的能耗,并应用于更多的场景。

2019年4月,华为披露,Boudica 120出货量突破700万;性能更优越的Boudica 150出货量则突破了1300万。

2020年推出Boudica200,支持3GPPR15及后续标准演进,拥有更优的集成度、安全性与开放性。

布局二:凌霄系列WiFi芯片

在路由器的现实使用中,掉线、延时、卡顿等问题普遍存在,为了解决这些问题,华为研发了凌霄系列路由芯片,由路由CPU、路由WiFi芯片、电力猫芯片三大产品线组成。

2018年12月,凌霄芯片正式亮相,荣耀路由Pro 2搭载了凌霄5651和凌霄1151。其中,凌霄5651为四核1.4GHz CPU,凌霄1151为双频Wi-Fi芯片。

2019年的华为开发者大会(HDC2019)上,华为正式发布凌霄WiFi-loT芯片,服务于华为的全场景智慧生活战略。该芯片于2019年底上市,用于家庭接入类产品。

(五)始于安防、彰于显示的视频芯片:鸿鹄

布局一:安防芯片

安防产品需要四类芯片:ISP(图像信号处理)芯片对前端摄像头采集的信号进行处理,DVR(数字硬盘录像机)SoC芯片用于模拟音视频的数字化、编码压缩与存储,IPC(IP摄像机)SoC芯片支持视频分析,NVR(网络硬盘录像机)SoC芯片用于视频数据存储。

海思芯片事业起步于安防领域,首先量产的是安防芯片,并在与德州仪器、博通等巨头的竞争中茁壮成长。不同于德州仪器采用的ARM+DSP架构,海思采用ARM+IVE架构,在功耗、成本和运算效率上具备优势。

目前,海思是全球IPC芯片的领头羊,市场份额一度高达70%;在其他三大类芯片中,海思同样具有较高的市场份额。在市场开拓方面,海思同海康威视、大华长期保持紧密合作。

布局二:机顶盒芯片

在安防芯片领域取得巨大成就的同时,2008年海思也开始积极发力机顶盒芯片,并在与意法半导体和高通等的竞争中崭露头角,基本做到国内第一,全球第二,仅次于博通。智能机顶盒芯片方案分为OTT和IPTV两种,根据格兰研究,2018年,我国IPTV/OTT机顶盒采用的芯片方案以海思和晶晨为主。

布局三:鸿鹄系列显示芯片

鸿鹄芯片主要用于智慧显示领域。华为已积累多年,海思于2014年就推出首款4K电视芯片。华为2019年透露,鸿鹄视频显示芯片累计发货已超4000万片。

2019年7月,华为发布的荣耀智慧屏率先搭载了鸿鹄818芯片。鸿鹄818采用双A73+双A53架构CPU和4*Mali-G51 GPU,解码速度领先。鸿鹄818具备动态画面补偿、高动态范围成像等七重画质技术,集成Histen音质优化技术,能给用户带来出色的音画体验。

目前,华为五大芯片系列正并驾齐驱,在各自的领域均取得了突破性成就,成功走出了一条“逆袭”之路。

回望华为芯片事业刚刚起步的1991年,正是当时对芯片独立自主的觉醒,才为如今的辉煌埋下了伏笔;

正是在一步一步的试错中,才走出了一条独立设计之路。

展望未来,随着我国自主创新力量的不断崛起,以“中国芯”为底座的IT产业必将迎来巨大机会,华为公司作为国产之光,在“开源、开放”的战略下,有望带领产业链相关公司快速崛起。

•••展开全文
相关文章