遭美國打壓的華為在芯片方面能如何突破?麒麟990有哪些領先性?在移動通信領域業(yè)務引領全球、已經走入無人區(qū)的華為終端又會將智能手機帶到一個什么新高度?9月6日,麒麟990給出了答案!
文??|張國斌? 圖 華為公司/自攝?? ?? ?
9月6日,德國柏林,在下半年全球規(guī)模最大的消費電子展IFA上,華為消費者業(yè)務CEO余承東發(fā)表了“Rethink Evolution”主題演講,正式發(fā)布了業(yè)界期待已久的華為年度旗艦機平臺麒麟990系列---包括全球第一款采用7nm +EUV工藝的5G SoC旗艦機芯片麒麟990 5G和4G版麒麟990兩款芯片。麒麟990 5G在性能與能效、AI智慧算力及ISP拍攝能力等方面進行全方位升級,繼續(xù)打造手機體驗新標桿。麒麟990系列芯片將在華為Mate30系列首發(fā)搭載。該款產品將于9月19日在德國慕尼黑全球發(fā)布。
華為麒麟990發(fā)布會的主題是“重構”,麒麟990到底要重構什么?如何看待麒麟990的領先性?下面筆者嘗試做一下解讀。概括起來麒麟990實現(xiàn)了六大領先。 ? ? ?
1、工藝領先,全球首款7nm+EUV?IC? ? ? ?
麒麟990 5G是華為推出的全球首款旗艦5G SoC,是業(yè)內最小的5G手機芯片方案,基于業(yè)界最先進的7nm+ EUV工藝制程,首次將5G Modem集成到SoC芯片中,面積更小,功耗更低。它在一顆指甲大小的芯片上集成了103億晶體管,是目前晶體管數最多、功能最完整、復雜度最高的5G SoC,這得益于它采用了目前全球最先進的半導體工藝——7nm +EUV工藝。
這是麒麟990實際大小
在先進工藝技術方面,華為自2015年在麒麟950率先采用了業(yè)界當時最先進的16nm FinFET工藝之后就一路領先,總是采用業(yè)界最先進的工藝技術打造麒麟平臺,麒麟980是業(yè)績首款量產7nm工藝的手機平臺,這次,麒麟990也率先采用了7nm+ EUV,這也得益于華為和臺積電堅實的戰(zhàn)略級合作伙伴關系。 在EUV工藝演進上,麒麟芯片早在2014年就開始了EUV技術的儲備,聯(lián)合產業(yè)界合作伙伴共同研發(fā)并促進EUV技術成熟。為了讓最新的EUV工藝能夠帶給消費者穩(wěn)定可靠的高品質體驗,麒麟990 5G在實現(xiàn)高性能和高能效的基礎上,進行了大量關鍵技術驗證,為手機用戶提供最可靠的技術保障。 今年5月26日,臺積電首席執(zhí)行官表示該公司7nm+ EUV已開始批量生產,這是臺積電第一次、也是行業(yè)第一次量產EUV極紫外光刻技術。雖然對外沒有宣稱是什么產品采用這個工藝,但是現(xiàn)在看來可能當時量產的就是麒麟990。 7nm+ EUV量產成功也意味著半導體工藝再次躍上新的臺階。從余承東實際公布的數據看,采用這個工藝的麒麟990基于7nm +EUV 板級面積縮小? 36%功耗,雖然有103億個晶體管但是芯片尺寸比同類競品都小30%左右。
麒麟990和同類產品尺寸對比 ? ? ?
2、通信性能全球領先 超越對手PPT新品? ? ? ?
在先進工藝的支持下,同等面積大小的IC可以塞下更多晶體管,麒麟990也成為首顆晶體管數量超過100億的5G SoC芯片,而衡量一個芯片領先性的重要指標之一就是晶體管數量,另外,麒麟990率先支持NSA/SA雙架構和TDD/FDD全頻段,充分應對不同網絡、不同組網方式下對手機芯片的硬件需求,是業(yè)界首個全網通5G SoC。 基于巴龍5000卓越的5G聯(lián)接能力,麒麟990 5G在Sub-6GHz頻段下實現(xiàn)領先的2.3Gbps峰值下載速率,上行峰值速率達1.25Gbps,帶來業(yè)界最佳5G體驗。在麒麟990正式發(fā)布之前,曾有兩家友商發(fā)布也發(fā)布了5G SoC芯片,一家是三星電子,它在9月4日發(fā)布了號稱采用8nm的首款集成5G基帶的移動SoC芯片Exynos 980,該芯配備兩顆Cortrex A77大核(2.2GHz)和四顆Cortex A55小核(1.8GHz),GPU為Mali G76 MP5。---這個參數也低于麒麟990的參數指標后文有介紹。
在通訊性能方面,三星稱Exynos 980可以在Sub 6GHz頻段的5G網絡下最快達到2.55Gbps,4G最高1Gbps,雙模并行達到3.55Gbps。但是很奇怪的有兩點:
1、目前支持5G標準(4MIMO/256QAM調制等。。。)的理論極限下載極限是2.3Gbps,但是三星號稱搞出了2.55Gbps的下載速度,不知道這個速率咋么來的,三星也未做任何解釋,在我質詢三星中國之后也沒有得到答案。
華為手機產品線副總裁李小龍也表示,因為基于3GPP R-15協(xié)議標準,100MHz帶寬能實現(xiàn)的理論速率最高為2.34Gbps?;谶@個限制,在過去無論華為、高通還是MTK,對外宣稱的速率都是2.3Gbps。今天有廠商突破了這個極限,一定有什么奇跡發(fā)生。 2、沒有公布芯片實際面積大小。
另外,該芯片要到年底才開始量產,實際上目前僅僅是樣片階段。采用該芯片的5G手機要到2020年年中面市了!怪不得余承東在IFA發(fā)布會上直呼友商是PPT新品了。第二家是聯(lián)發(fā)科,聯(lián)發(fā)科在今年5月底宣布送樣旗下首款集成5G基帶的SoC,它采用7nm工藝,CPU大核同樣是Cortex -A77,GPU是Mali G77,號稱5G下行最快速度達到4.7Gbps!這款基帶支持 6GHz 以下的 5G NR 頻譜、高達 2x 的載波聚合、以及獨立 / 非獨立的 5G 網絡架構。
奇怪的仍是兩點:? 1、其下載速度也是遠遠超過了5G的理論極限,是如何實現(xiàn)的? 2、該公司未披露確切的 SoC 命名和詳細規(guī)格。
同樣這顆芯片要到2020年Q1量產,采用該芯片的手機則要到2020年下半年面市了!
就以上問題我在發(fā)布會上問過華為院士艾偉先生,他說華為也不知道這個數值如何得來,并表示運營商都很疑惑這個數值他也請我向兩家廠商求證。 所以綜上所述,我認為麒麟990是全球目前唯一一款采用7nm EUV工藝量產的SoC芯片!唯一一款通信指標達到5G標準的手機平臺,沒有之一。
另外,麒麟990率先支持5G雙卡,一卡5G上網的同時,另一卡可接聽VoLTE高清語音通話,實現(xiàn)業(yè)界最佳5G雙卡體驗。此外,麒麟990 5G實現(xiàn)業(yè)界最佳5G能效,相比傳統(tǒng)的4G SoC+5G Modem的解決方案,功耗表現(xiàn)優(yōu)20%,帶來更長效持久的5G體驗。 此外,麒麟990還針對5G的特點做了大量優(yōu)化,5G商用初期,由于網絡覆蓋不完善,5G還面臨著弱信號場景聯(lián)接不穩(wěn)定、功耗較高、高速移動場景聯(lián)接體驗不佳等挑戰(zhàn),影響用戶的上網體驗?;谠?G領域的技術積累,麒麟990 5G全面升級5G通信實力。在5G信號較弱的場景下,麒麟990 5G推出智能上行分流設計,在視頻直播、短視頻上傳等應用場景同時使用5G和4G網絡,上傳速率提升5.8倍,優(yōu)化5G上行體驗;
5G功耗挑戰(zhàn)很大,為解決5G帶來的功耗問題,麒麟990 5G率先支持BWP(Bandwidth Part)技術,在5G大帶寬條件下實現(xiàn)帶寬資源的靈活切換,與業(yè)界主流旗艦芯片相比,5G功耗表現(xiàn)優(yōu)化44%,帶來更長效的5G體驗;面向高速移動場景,麒麟990 5G支持基于機器學習的自適應接收機,實現(xiàn)更精準的信道測量,下行速率提升19%,實現(xiàn)穩(wěn)定的5G聯(lián)接。 麒麟990也是業(yè)界首個5G全網通SoC,持續(xù)引領5G行業(yè)發(fā)展方向,除了提供增強的個人移動體驗之外,5G還肩負著改變社會的重要使命,驅動移動通信與各行各業(yè)相結合,構建萬物互聯(lián)的智能世界。 5G時代,組網方式有SA(獨立組網)和NSA(非獨立組網)兩種選擇,但NSA只實現(xiàn)了超高帶寬,只有SA才能更好地實現(xiàn)低時延和海量連接。而低時延和海量連接,正是整個行業(yè)實現(xiàn)數字化、智能化的必然需求。近日,工信部也表示自2020年1月1日起,申請入網的5G終端需要同時支持獨立組網和非獨立組網(SA和NSA)。綜合來看,NSA是5G初期的過渡方案,成熟的5G解決方案必須具備同時支持SA和NSA的能力。
華為院士艾偉
據介紹,華為從2009年起開始致力于5G的研究和開發(fā),經過多年努力,已經具備從5G核心網到基站,到5G手機、5G CPE和5G Modem都同時支持SA和NSA的端到端解決方案。此次發(fā)布的麒麟990 5G也是業(yè)界首個全網通5G SoC,率先同步支持SA/NSA 5G雙模組網,全面推進5G產業(yè)發(fā)展,引領5G技術方向;率先支持TDD/FDD全頻段,適用于所有5G網絡頻段需求,助力運營商更快部署5G網絡,盡早為消費者帶來更成熟的5G體驗。
3、GPU領先,16核GPU打造極致游戲體驗 ? ? ?
? 在CPU方面,麒麟990 5G仍然采用了類似麒麟980的大中小核架構--2個大核(基于Cortex-A76開發(fā))+2個中核(基于Cortex-A76開發(fā))+4個小核(Cortex-A55)的三檔能效架構,最高主頻可達2.86GHz,與業(yè)界主流旗艦芯片相比,單核性能高10%,多核性能高9%。能效方面針對不同大小的核精細調校,大核能效優(yōu)12%,中核能效優(yōu)35%,小核能效優(yōu)15%,帶來更快的手機應用打開速度,日常使用體驗更加流暢。?
GPU方面,余承東表示麒麟芯片始終追求更好的用戶體驗。針對GPU在運行重載游戲、播放高清視頻等高負載場景下容易出現(xiàn)的發(fā)熱、掉幀、卡頓等問題,麒麟990 5G搭載16核Mali-G76 GPU,與業(yè)界主流旗艦芯片相比,圖形處理性能高6%,能效優(yōu)20%,實現(xiàn)業(yè)界領先的性能與能效。
艾偉表示華為考慮的更多是如何從系統(tǒng)層面優(yōu)化和升級用戶體驗,所以華為通過全新系統(tǒng)級Smart Cache分流,支持智能分配DDR數據,在重載游戲等大帶寬場景下帶寬較上一代最高可節(jié)省15%,功耗可降低12%,進一步提升GPU能效。? ? ? ?
另外,針對游戲場景,麒麟990 5G推出Kirin Gaming+ 2.0,基于性能、能效強大的CPU、GPU與DDR芯片,Kirin Gaming+ 2.0推出高性能、高能效、高畫質游戲解決方案,實現(xiàn)業(yè)界頂級游戲體驗。 Kirin Gaming+ 2.0的核心技術是全新升級的AI調頻調度技術,在CPU、DDR系統(tǒng)調頻調度中全新引入GPU融合調度,并加入游戲關聯(lián)線程優(yōu)化技術,動態(tài)感知性能瓶頸。不僅如此,Kirin Gaming+通過對100萬幀以上的游戲畫面大數據進行學習,建立了精準的Kirin Gaming+游戲性能功耗模型,將性能功耗調度細化到游戲每一幀畫面中,游戲幀率穩(wěn)定60幀,每幀負載調頻準確性提升30%。同時,麒麟990 5G支持HDR 10特效,游戲畫質更高清,游戲體驗更加真實沉浸。 這里有筆者拍攝的現(xiàn)場演示視頻可以感受到麒麟990強大的游戲能力
有網友驚呼,“應該跟索尼合作移植PS游戲到手機上來,體驗太爽!” ?
? ?4、AI領先業(yè)界,達芬奇架構顯神威? ?
? ? 在端側AI的發(fā)展歷程中,麒麟芯片始終引領著產業(yè)方向。2017年,麒麟970在業(yè)內首次采用獨立NPU神經網絡處理單元,開創(chuàng)端側人工智能的行業(yè)先河。2018年,麒麟980搭載雙核NPU實現(xiàn)領先的AI算力,帶來AI人像留色、卡路里識別等一系列創(chuàng)新AI體驗。2019年,全新高端系列麒麟810更是首次采用華為自研達芬奇架構NPU,打破端側AI性能紀錄。麒麟990又帶來什么?
它就是NPU大核+NPU微核創(chuàng)新設計架構--麒麟990 5G是首款采用華為自研達芬奇架構NPU的旗艦級芯片,創(chuàng)新設計NPU雙大核+NPU微核計算架構,NPU大核展現(xiàn)卓越性能與能效,微核NPU實現(xiàn)超低功耗。 事實勝于雄辯,讓人震驚的是麒麟990的算力提升!相比麒麟980,采用華為自研達芬奇架構的麒麟990算力提升高達476%!等于提升了近5倍算力!可以預計,在AI+5G的全新賽道,麒麟990 5G將再度引領AI潮流。在雙大核NPU(Ascend Lite*2)加持下,麒麟990 5G實現(xiàn)業(yè)界最強AI算力,與業(yè)界其他旗艦AI芯片相比,性能優(yōu)勢高達6倍,能效優(yōu)勢高達8倍,持續(xù)刷新端側AI的算力高點。無論是在業(yè)界典型的中載神經網絡模型ResNet50(用于檢測、分割和識別),還是在移動端更流行的輕載神經網絡模型MobilenetV1(用于分類、檢測、嵌入和分割)下,麒麟990 5G的FP16和int8性能和能效均達到業(yè)界最佳水平。業(yè)界首發(fā)NPU微核(Ascend Tiny)賦能超低功耗應用,在人臉識別的應用場景下,NPU微核比大核能效最高可提升24倍,讓AI運算更省電。
余承東解釋說,這好比一條高速路上讓打車拉大貨物小車拉小貨物,配比更了合理道路使用更高效。
而基于麒麟990 5G的AI強勁算力,過去很多受限于功耗和算力的應用都將成為可能。麒麟990 5G使能AI多人實時換背景,通過先進的AI多實例分割技術,能夠將視頻畫面中的每一個人物主體單獨識別出來,實現(xiàn)多人物視頻拍攝替換背景,甚至可以選擇畫面中需要保留的人物,讓視頻應用充滿更多想象。AI視頻超分能夠基于麒麟990 5G的AI智慧,還原老舊設備拍攝的視頻畫質,畫面瞬間達到高清質感。未來,麒麟990 5G強大的AI算力和豐富的開放能力,將進一步賦能AI應用,結合5G高速率、低時延、廣聯(lián)接的特征,探索更多智慧應用。
這是現(xiàn)場拍攝的實時視頻背景變換
為何麒麟990? AI性能如此強大?這是因為它采用了華為獨立開發(fā)的達芬奇架構。 在2018年華為HC大會上,華為輪值董事長徐直軍發(fā)布了華為全棧全場景AI解決方案,首次公布了華為自研的達芬奇架構,并宣布基于達芬奇架構的系列化AI芯片:Max,Mini,Lite,Tiny和Nano五個系列。這五個系列可以理解為超大號、大號、中號、小號、超小號,它們能滿足全應用場景的AI計算需求。
達芬奇架構是華為自研的面向AI計算特征的全新計算架構,具備高算力、高能效、靈活可裁剪的特性,是實現(xiàn)萬物智能的重要基礎。華為Fellow艾偉解釋說達芬奇架構采用的是3D Cube架構,它是一種三維的架構,可以針對矩陣運算做加速,大幅提升單位功耗下的AI算力,每個AI Core可以在一個時鐘周期內實現(xiàn)4096個MAC操作,相比傳統(tǒng)的CPU和GPU實現(xiàn)數量級的提升。 艾偉解釋說達芬奇架構內部還細分成很多單元,包括核心的3D Cube、Vector向量計算單元、Scalar標量計算單元等,它們各自負責不同的運算任務實現(xiàn)并行化計算模型,共同保障AI計算的高效處理。同時,為了提升AI計算的完備性和不同場景的計算效率,達芬奇架構還集成了向量、標量、硬件加速器等多種計算單元。同時支持多種精度計算,支撐訓練和推理兩種場景的數據精度要求,實現(xiàn)AI的全場景需求覆蓋。
其中,AI計算的核心是矩陣乘法運算,計算時由左矩陣的一行和右矩陣的一列相乘,每個元素相乘之后的和輸出到結果矩陣。在此計算過程中,標量(Scalar)、向量(Vector)、矩陣(Matrix)算力密度依次增加,對硬件的AI運算能力不斷提出更高要求。典型的神經網絡模型計算量都非常大,這其中99%的計算都需要用到矩陣乘,也就是說,如果提高矩陣乘的運算效率,就能最大程度上提升AI算力——這也是達芬奇架構設計的核心:以最小的計算代價增加矩陣乘的算力,實現(xiàn)更高的AI能效。
華為創(chuàng)新設計的達芬奇架構將大幅提升算力,16*16*16的3D Cube能夠顯著提升數據利用率,縮短運算周期,實現(xiàn)更快更強的AI運算。舉例來說,同樣是完成4096次運算,2D結構需要64行*64列才能計算,3D Cube只需要16*16*16的結構就能算出。其中,64*64結構帶來的問題是:運算周期長、時延高、利用率低。?? 采用達芬奇架構的麒麟810h是達芬奇在端側領域的嘗試,小試牛刀NPU性能就超越了友商同類產品,麒麟810在單位面積上實現(xiàn)最佳能效,F(xiàn)P16精度和INT8量化精度業(yè)界領先,搭載這款SoC芯片的華為Nova 5、Nova 5i Pro及榮耀9X手機已上市,為廣大消費者提供多種精彩的AI應用體驗。 而采用達芬奇架構的超大號NPU昇騰910則性能爆棚,半精度(FP16)算力達到256 Tera-FLOPS,整數精度(INT8)算力達到512 Tera-OPS!成為算力最強AI處理器,它在訓練領域大顯身手。?
5、ISP再次創(chuàng)新,影像領先業(yè)界? ?
? 自從麒麟950搭載華為自己研發(fā)的ISP后,華為不斷在ISP上進行創(chuàng)新,這次麒麟990采用的是全新ISP 5.0,吞吐率提升15%,能效提升15%,全面優(yōu)化視頻處理能力,并把單方相機的降噪技術應用到手機端。?
在夜晚、光線較弱的暗光環(huán)境下,視頻拍攝出現(xiàn)的噪點非常影響成像質量。從噪聲類型來說,視頻拍攝中出現(xiàn)的主要是時域噪聲和空域噪聲。其中,時域噪聲是前后幀畫面播放隨時間變化產生的噪聲,空域降噪是每一幀視頻畫面原本存在的固有噪聲。業(yè)界在視頻降噪方面大多采用單一的時域降噪,主要消除時間維度帶來的噪聲。
此次,麒麟990 5G全球首發(fā)雙域聯(lián)合視頻降噪技術,針對視頻中的高頻、中頻、低頻噪聲混合的場景,增加頻域降噪過程,重點針對噪聲進行精準分離處理,視頻降噪能力提升20%,暗光環(huán)境下拍攝的視頻更加清晰。首次在手機芯片上實現(xiàn)基于AI分割的實時視頻后處理渲染技術,對每一幀視頻畫面色彩精心調色,讓手機視頻也能擁有電影調色質感。
同時,手機在暗光場景下的拍照能力也始終是用戶關注的焦點。麒麟990 5G首次在手 機芯片上實現(xiàn)BM3D(Block-Matching and 3D filtering)單反級硬件降噪技術,首次將單反級的圖像處理能力應用在手機上,照片降噪能力提升30%,暗光場景噪點更少,讓手機大片越夜越美麗。 ? 基于ISP的能力升級,麒麟990 5G支持全新炫酷Face AR。通過從攝像頭捕獲的人臉圖像數據和基于NPU運行的神經網絡算法,F(xiàn)ace AR能夠對人臉進行建模、實時跟蹤、表情捕獲,并且可以進一步分析出人臉信息背后的諸如心率、呼吸率等健康數據,提供圍繞人臉的豐富的AR增強現(xiàn)實體驗,探索AR應用的更多可能。 麒麟990有一個演示非常酷,就是用前置攝像頭測試人的心率,它的原理是當用戶的心臟跳動時,會有更多的血液流過用戶臉部,綠光的吸收量也會越大。在心臟跳動間隙,血液流量減少,導致綠光的吸收也會減少。通過復雜精密的算法將心率信號有效監(jiān)測并提取出來。利用CMOS傳感器可以計算出血液中透光率的脈動變化,折算成電信號,對應就是心率。 拍照的同時還能測心率,酷吧,如果把這應用用到《非常勿擾》相親節(jié)目上,不是很有趣?可以知道女嘉賓哪個男嘉賓真正心動?
6、AI生態(tài)領先,開放帶來無限可能? ?
華為創(chuàng)始人任正非經常提出熵減概念,就是要通過開放耗散企業(yè)的熵值,在人工智能領域,華為通過HiAI生態(tài)保持領先,這次華為也帶來 HiAI2.0持續(xù)賦能AI應用開發(fā),探索AI+5G無限可能。 隨著AI+5G時代的到來,輕量化、免安裝、跨平臺和更多的交互體驗將成為未來應用的發(fā)展趨勢,這也要求手機芯片具備5G芯端云一體化的AI能力,以及大數據、平臺化等更多創(chuàng)新技術集群?;谌A為推出的全新達芬奇架構NPU和HiAI Foundation芯片能力開放,麒麟平臺將持續(xù)為開發(fā)者提供更強大的端側算力,充分激發(fā)端側AI的運算潛能。
艾偉表示此次,麒麟990 5G也將為HiAI 2.0開放平臺注入新的能量,助力開放能力進一步升級——支持300+算子,業(yè)界最多;提供完備的IDE工具,Android Studio插件,支持代碼自動生成,提高開發(fā)效率;提供達芬奇架構IR開放,支持業(yè)界主流框架對接,實現(xiàn)更加完備的兼容性,讓算法開發(fā)者保持原有的開發(fā)習慣,在HiAI平臺上自動獲取加速能力,為開發(fā)者提供更強大的工具鏈,探索AI+5G應用的無限可能。
作為5G和AI時代的引領者,華為將充分發(fā)揮麒麟平臺的創(chuàng)新技術優(yōu)勢,面向開發(fā)者全面開放芯片能力,讓更多開發(fā)者加入到全場景、智慧化的新應用的開發(fā)隊列中來,共同促進應用產業(yè)的繁榮發(fā)展。
此外,與麒麟990 5G一起亮相的麒麟990,同樣在性能、能效、AI及拍照方面實現(xiàn)重磅升級,為現(xiàn)階段更廣泛的4G手機用戶提供更卓越的使用體驗。
艾偉表示5G時代本土力量首次領先,基于中國完整的5G體系,可以創(chuàng)新出 很多新的商業(yè)模式和應用,如同4G激發(fā)了抖音、快手等短視頻應用一樣,5G必然會催生新一波機遇,重構生態(tài)和商業(yè),我想這才是麒麟990領先帶來的真正意義!
有了麒麟990的加持,華為年度旗艦機Mate30毫無無疑問將成為年度安卓機皇!9月19日將揭曉,我們拭目以待!
評論