华为mate60的意义
华为Mate 60系列“于无声处爆惊雷”,在中国当天就引起海啸式的反应。几天后,西方也终于从蒙圈中苏醒过来,开始琢磨这是怎么回事了。这三年是华为苦难行军的三年。手机业务从世界领先直接掉入深渊,但华为还...
2024.11.21华为公司三十年芯片自研之旅回溯
1991年,华为芯片事业刚起步,由集成电路设计中心负责。
当时,华为面临着芯片成本高、产品利润空间小的困境。首款流片成功的芯片为SD502,用于交换机多功能接口控制。
1993年,华为依托海外采购的EDA软件,成功开发出支持无阻塞时隙交换的SD509,并用于自主研发的第一台数字程控交换机C&C08,该款交换机后成为全球销量最大的交换机之一。
1995年,华为中央研究部成立,下设基础业务部,接手通信系统芯片研发工作。
2004年,华为决定成立海思半导体,以数字安防芯片起家。
2009年,推出一款GSM低端智能手机的一站式解决方案,芯片名为K3V1,开启了手机芯片的漫漫探索之路。
此后,华为2012实验室成立,海思归属实验室管辖,但地位等同于华为一级部门。
经历三十载的辛勤探索,目前,华为共有五大系列芯片。
麒麟芯片为手机SoC芯片,集成应用处理器与基带处理器,广泛应用于华为系列手机上。
计算芯片中,鲲鹏用于高性能计算,昇腾为商用AI芯片。
通信芯片中,巴龙与天罡分别用于基带与基站,正打造5G布局。
联接芯片对应万物互联时代,包括Boudica与凌霄两大品牌。
视频芯片是华为长期发力的方向,安防芯片、机顶盒芯片占据大量市场份额,芯片出货量也达到千万级。
快速崛起的计算芯片双底座:鲲鹏、昇腾
当今数字化时代,万物互联带来数据量的爆发式增长,向IT基础架构的计算能力提出了更高要求。IDC预测,到2023年,全球计算产业投资空间高达1.14万亿美元,中国占比近10%,是全球计算产业发展的重要驱动。
为满足新算力需求,华为围绕“鲲鹏+昇腾”双算力引擎,打造了“算、存、传、管、智”五个子系统的芯片族,实现了计算芯片领域的全面自研。华为是唯一同时拥有“CPU、NPU、存储控制、网络互联、智能管理”5大关键芯片的厂商。我们将重点围绕核心芯片“鲲鹏+昇腾“展开分析。
2023年,何庭波任华为董事、科学家委员会主任、ITMT主任、海思总裁!
(一)计算芯片鲲鹏系列
鲲鹏系列包括服务器和PC机处理器。
早在十余年前,华为开发的嵌入式CPU Hi1380小有所成,成为鲲鹏处理器的开端。
后历经鲲鹏912、916两代产品,最终开发出旗舰产品鲲鹏920与鲲鹏920S,分别用于服务器和PC机。
鲲鹏处理器具备“端边云算力同构”的优势。
其基于ARM V8架构,处理器核、微架构和芯片均由华为自主研发设计。
市场上目前存在超过500万基于ARM指令集的安卓应用,与ARM服务器天然兼容,无需移植即可直接运行,且运行过程中无指令翻译环节,性能无损失,相比X86异构最高能够提升3倍性能。
2019年1月,华为宣布推出业界最高性能ARM架构处理器——鲲鹏920,以及基于鲲鹏920的TaiShan服务器和华为云服务。
鲲鹏920处理器,采用7nm制造工艺。
规格方面,支持64内核,主频可达2.6GHz,集成8通道DDR4,支持PCIe4.0及CCIX接口,可提供640Gbps总带宽。
鲲鹏920主打低功耗、强性能,在典型主频下,SPECint Benchmark评分超过930,超出业界标杆25%;同时,能效比优于业界标杆30%。
之前的记录保持者是富士通的7nm A64X,每个芯片可以达到2.7 teraflops的性能。
除了发布鲲鹏920处理器,华为还推出了三款泰山ThaiShan系列服务器,使用的就是自家的服务器芯片:
包括TaiShan 2280、Thaishan 5280/5290、ThaiShan X6000,
分别面向均衡服务器、存储服务器及高密度服务器市场,具体规格如下:
华为研发高性能ARM服务器处理器已经不是新闻了,之前就有过基于Cortex-A57架构的32核服务器芯片,只不过并没有大规模推广。
此前还有爆料称华为自主研发64核ARM服务器芯片Hi1620,基于7nm工艺。
2019年1月发布的鲲鹏920,就是这款产品Hi620的正式品牌及型号,跟“麒麟”处理器一样,也是使用了中国古代神兽的名字“鲲鹏”!
鲲鹏(Kunpeng )920芯片的架构:
1、Chip:芯片(Chip)是指有大规模集成电路的硅片,我们见过的cPu这种是最常见的芯片。一般几块硅片可以封装在一起组成一个芯片。
2、DIE:芯片的最小物理单元。Kunpeng 920封装了3个DIE,两个用来做计算,第三个用来做IO。
晶粒(die)是以半导体材料制作而成未经封装的一小块集成电路本体,该集成电路的既定功能就是在这一小片半导体上实现。通常情况下,集成电路是以大批方式,经光刻等多项步骤,制作在大片的半导体晶圆,然后再分割成方型小片,这一小片就称为晶粒,每个晶粒就是一个集成电路的复制品。
3、Core:真正的计算单元,我们在操作系统侧看到的“核”。
4、Cluster:若干个核(core)的集合。Kunpeng 920把4个core集合成为一个cluster,而一个DIE上有8个cluster。
5、soc:System on chip,例如,Kunpeng 920除了CPu外,还集成了RoCE 网卡、SAS控制器和南桥。
SoC可以理解为一个芯片集成了一个系统,可以完成特定的一系列的工作,例如,CPU是大脑,SoC是不仅有大脑,还有手、脚、身体等等,这些手脚就相当于,GPU,网卡处理器,声卡处理器等。
1片SoC上包含3个DIE,2个计算DIE,1个IO DIE。
1个计算DIE中8个Cluster。
1个Cluster中4个Core。
因此一个鲲鹏kunpeng 920芯片中包含4*8*2=64个核。
计算DIE上的每一个core具有自己的L1和L2级Cache,所有的core共享L3级Cache。
IO DIE上集成有网络模块、PCle模块。
这些DIE在芯片内部通过高速内部总线进行连接。
计算芯片昇腾系列
在摩尔定律逐渐失效的情况下,AI芯片有助于解决算力问题。昇腾系列是华为全面AI战略的重要支撑。
2018年华为全联接大会上,昇腾310与910同时发布,证实了外界对华为研制AI芯片的猜测。
昇腾310面向边缘场景,高效、灵活、可编程。基于典型配置,八位整数精度(INT8)下的性能达到16TOPS,16位浮点数(FP16)下的性能达到8 TFLOPS,而其功耗仅为8W。
基于已实现量产的昇腾310,华为发布Atlas 200、Atlas 300、Atlas 500、Atlas 800等产品,广泛应用于安防、金融、医疗、交通、电力、汽车等行业。
昇腾910面向训练场景,具有超高算力,其最大功耗为310W,自研的达芬奇架构大大提升了其能效比。
八位整数精度下的性能达到512TOPS,16位浮点数下的性能达到256 TFLOPS。
昇腾910的测试表现远超NVIDIATesla V100和Google TPU v3。
2019年8月,910正式发布,标志着华为AI战略的执行进入新的阶段。
未来,针对不同场景,华为仍将持续推出更多的AI处理器,提供更充裕、更经济、更适配的AI算力。
华为部分在研与规划的AI芯片包括,用于自动驾驶开发的昇腾610、310升级而来的昇腾320以及910升级而来的昇腾920。
介绍一下达芬奇架构:
达芬奇架构本质上是为了适应某个 特定领域 中的常见应用和算法。通常称为 “特定域架构 ”
(Domin Specific Architecture,DSA)。
达芬奇架构包括三种基础计算资源:
矩阵计算单元 (CubeUnit)、
向量计算单元 (Vector Unit) 和 标量计算单元 (Scalar Unit)。
在实际的计算过程中各司其职,形成了三条独立的执行流水线,在系统软件的统一调度下互相配合达到优化的计算效率,并且每一种计算单元都提供了不同精度和不同类型的计算方式。
达芬奇架构包含:scalar,tensor和cube运算,灵活性scalar>tensor>cube,效率 scalar
华为Mate 60系列“于无声处爆惊雷”,在中国当天就引起海啸式的反应。几天后,西方也终于从蒙圈中苏醒过来,开始琢磨这是怎么回事了。这三年是华为苦难行军的三年。手机业务从世界领先直接掉入深渊,但华为还...
2024.11.21今天我们一起探讨华为Mate 60的神秘芯片,分析它的来龙去脉,探究其背后的故事。让我们一起走进这个科技创新的奇迹,领略华为自主研发的力量。近年来,华为在全球科技领域取得了举世瞩目的成就,不断推出的新...
2024.11.20今天下午2:30,所有科技爱好者们将聚焦在华为的秋季全场景新品发布会上。这场备受期待的发布会将展示众多令人激动的新品,其中包括华为智慧屏V5 Pro旗舰新品和华为MatePad Pro 13.2英寸旗...
2024.11.21华为在2023年第三季度的全球智能手机出货量上涨44%,Mate60系列产品强劲销售推动了国内市场年均增长率达50%。这一成就令人惊叹,特别是在美国的制裁下,华为不但没有倒下,还表现出了极强的抗打击能...
2024.11.21选择手机:华为P40与华为Mate30 5G的比较在选购手机时,我们通常需要综合考虑各种因素,尽量购买性能综合更强的手机。在这个方面,华为Mate30 5G明显比华为P40更具优势。接下来,我们一起来...
2024.11.19