文章摘要: 相對於IFA的亮相,華為fellow艾偉對國內媒體進行了更加詳細的介紹與講解,我們也因此得知了更多關於麒麟980的技術細節。「Fellow」相當於華為研發領域序列最高的科學家,在華為8萬名技術工程師中僅30餘名,艾偉也是華為晶片業務——麒麟的產品規劃負責人。
北京時間8月31日晚上8:00,華為在德國IFA大展上,正式釋出了全新一代旗艦晶片——麒麟980。
一週後的9月5日,麒麟980技術溝通會在上海召開。
相對於IFA的亮相,華為fellow艾偉對國內媒體進行了更加詳細的介紹與講解,我們也因此得知了更多關於麒麟980的技術細節。「Fellow」相當於華為研發領域序列最高的科學家,在華為8萬名技術工程師中僅30餘名,艾偉也是華為晶片業務——麒麟的產品規劃負責人。
下面,就讓我用盡可能通俗易懂的文字,將艾偉先生的專業解讀「翻譯」給大家。
首次商用TSMC 7nm製造工藝
只要稍微具備一定IT基礎知識的人都知道,在半導體領域,先進的工藝就意味著更高的效能與更低的功耗。不過隨著行業不斷逼近摩爾定律的「極限」,想要駕馭更先進的工藝,勢必需要晶片設計方與代工廠深度合作。
目前,手機所使用的晶片普遍採用了10nm製程工藝,而麒麟980則首次商用了領先的TSMC 7nm製造工藝。與10nm工藝相比,7nm工藝效能提升20%,能效提升40%,電晶體密度提升到1.6倍。
在製程工藝升級演進的同時,伴隨而來的是對晶片設計的挑戰升級,7nm晶片的設計難度大大增加。從晶片工藝上看,7nm相當於70個原子直徑,逼近了矽基半導體工藝的物理極限,麒麟980需要克服複雜的半導體技術效應及電晶體本身的三維電阻電容帶來的影響。
艾偉在隨後的專訪中透露,晶片行業都是應用一代、研發一代、預研一代的「滾動研發」模式,麒麟980的立項時間是2015年,共有1000多位高階半導體專家參與,進行了超過5000次的工程驗證。對於外界稱華為斥資3億美元研發麒麟980的訊息,艾偉稱「晶片行業是一個投入巨大、風險巨大的投資」,並且按照行業規律,伴隨每一代工藝的提升,對應的投入都要翻倍。華為對麒麟晶片的投入也是每隔2-3年投入就會翻倍增長的,而且伴隨晶片創新,這種投入是一年比一年多,具體到麒麟980的投入並不好界定,但「投入遠遠超過3億美元」。
這也就意味著,全球首款採用7nm晶片的麒麟980,是華為歷史上投入最多、創新力度最大,同時也是成本最高,甚至是挑戰最大的一代核心處理器。
艾偉稱,麒麟980挑戰最大的,是三年前就要準確判斷7nm製程能不能在2018年10月這個時間點量產,如果最後產品準備好了,但晶片因7nm的技術問題未能量產,那麼就會造成很大的產品事故。
一款晶片的設計週期看似長達三年,但其實工作節奏非常緊密。以麒麟980為例,2015年立項,歷經了超過36個月的研發,2016年完成定製特殊基礎單元構建高可靠性IP論證,進入SoC工程化驗證已是2017年,再去掉早期晶片驗證的時間,實際剩下的量產週期僅約半年左右,對於麒麟研發團隊而言實際上只有兩次機會,也就是隻能允許一次投片修正,否則就會影響晶片的正常流片、量產和終端適配,造成產品延期上市甚至是專案失敗。
為此,艾偉表示,「從晶片企業未來趨勢來看,伴隨創新難度加大、投入加大,成本和風險提升,這個行業的商業回報率越來越低,未來只有少數玩家可以留在牌桌上,‘餘總之前預測全球手機品牌越來越少也是基於同樣的原因推斷’。」
我們現在無時無刻不在使用手機,對操作的流暢性和APP響應的及時性也提出新的要求。爲了應對這一挑戰,麒麟980在首次實現了基於Cortex-A76的開發商用,全新設計Kirin CPU子系統及Flex-Scheduling智慧排程機制,並首次商用Mali-G76 GPU,支援LPDDR4X顆粒,主頻最高可達2133MHz。
華為公佈了一些記憶體延遲和頻寬資料:在GeekBench 4的測試中,麒麟980的延遲為138ns,驍龍845為176ns。
「2+2+4」三檔能效架構
CPU方面,麒麟980首次實現基於Cortex-A76的開發商用,與上一代相比單核效能提升75%,能效提升58%。麒麟980還全新設計了Kirin CPU子系統,除了在CPU核心上針對終端業務進行了適配和優化外,對CPU排程演算法、匯流排設計等細節均進行了深度設計,保證Kirin CPU子系統從SoC整體設計上,更大地發揮出效能和能效優勢。
Kirin CPU子系統推出了Flex-Scheduling智慧排程機制,設計了2超大核(基於Cortex-A76開發)、2大核(基於Cortex-A76開發)、4小核(Cortex-A55)的三檔能效架構。相對於傳統的大小核兩檔位設計,三檔能效架構提供了更為精確的排程層次,讓CPU在過載、中載、輕載場景下靈活適配,大大降低了CPU在實際綜合業務場景下的功耗。
舉個簡單的例子,如果只是上班路上聽聽音樂,那麼呼叫小核就搓搓有餘。而晚上睡覺前躺著刷微博、購物等社交場景,大核也足以應對。但遇上玩遊戲,特別是大型3D遊戲,就必須啟動超大核,甚至多核全開。靈活的排程策略可以在效能體驗和功耗控制間找到最佳平衡。
全新Mali-G76 GPU,能效提升178%
在麒麟晶片的「傳統弱項」GPU方面,麒麟980首次商用了Mali-G76 GPU,與上一代相比效能提升46%,能效提升178%。其AI調頻排程技術,能夠實時學習幀率、流暢度和觸屏輸入變化,預測手機任務負載,動態感知手機使用過程中存在的效能瓶頸,及時進行調頻排程。
尤其是在遊戲場景下,使用AI調頻排程技術預測遊戲每幀負載,預測準確性相對於傳統預測方法可以提升30%以上,有效提升了遊戲平均幀率,大幅降低遊戲抖動率,減少遊戲卡頓,這對於手遊使用者來說至關重要。
而基於Mali-G76的麒麟980與GPU Turbo帶來的新「軟硬」系統級整合,圖形效能終於可以對驍龍旗艦完成逆轉超越。
從華為公佈的資料來看,以3D手機遊戲《NBA2K18》為例,麒麟980平均幀率接近60FPS,遊戲整體體驗超過業界同期水平。
艾偉表示:「今年10月16日首發搭載麒麟980處理器的華為Mate 20,將是年內能買到的效能最好的旗艦手機」。為什麼有這樣的自信?艾偉向我們透露:「餘總在內部經常講的一句話就是:‘沒有足夠的創新就不要做了’,每年手機產品線都有不少被餘承東‘腰斬’的產品,對於麒麟來說,每年迭代的巨大投入之後,有沒有足夠的創新讓產品線滿意,讓終端使用者和市場滿意,唯一衡量的標準就是銷量與口碑。」
第四代自研ISP,拍照能力繼續突破
作為手機日常使用的核心功能,拍照能力的提升一直是麒麟晶片關注的重點。麒麟980採用了全新升級的第四代自研ISP,畫素吞吐率比上一代提升46%,能夠分割槽域調節影象色彩與灰階;與麒麟970相比,支援更多攝像頭,適配多攝像頭帶來全新拍照體驗。
此外,麒麟980還推出全新HDR色彩還原,能夠分割槽域調節影象色彩,實現照片色彩與細節的平衡。
針對暗光拍攝場景,麒麟980採用全新Multi-pass多重降噪技術,精準降低夜景照片中的噪點,細節保留更加完整,夜拍效果更加通透清晰。同時,運動場景下大幅提升跟蹤準確率,在拍攝運動中的人物時,人臉識別檢測率提升至97.4%。
視訊方面,麒麟980採用視訊專用的Pipeline「處理流水線」技術提升視訊清晰度,視訊拍攝時延降低33%。稍顯遺憾的是麒麟980的視訊編碼能力,仍然維持在[email protected]的水平上,對於一款全新的SoC來說不夠完美。
雙核NPU,每分鐘識別影象4500張
在雙核NPU的移動端算力加持下,麒麟980能使人臉識別、物體識別、物體檢測等AI場景,採用更高精度的深度網路,具備更佳的實時性。實現每分鐘影象識別4500張,識別速度相比上一代提升120%;多人姿態估計實時幀率高達30 FPS,無論是表演節奏感極強的舞蹈,還是在鏡頭前快速跑步,都能夠實時繪製出人體的關節和線條;強大的物體檢測能力可以準確識別多種物體,並可以做到拍照預覽的實時物體跟蹤。
麒麟980還帶來了「慧眼2.0」,在手機視覺入口提供了一個「感知、測量、認知、計算」的端到端完整解決方案,人工智慧技術深度參與視覺處理的各個環節,通過後臺基礎演算法的極大提升和流程優化,讓使用者明顯感知到體驗的大幅增強。
在AI能力上,麒麟980提供高精度人臉識別與肢體檢測識別,結合自研ISP強大的影象處理演算法,使得在暗光夜晚和白天高動態場景下,都能準確識別拍攝主體和運動物件,並且保持著每秒30幀實時跟蹤運動主體。
此外,精細化的視訊分割、主體摳圖等能力,也極大豐富了小視訊類應用的創作靈感。更為重要的是,華為對第三方APP開放上述能力,加上具備不間斷執行各種AI任務的基礎能力,構成了「慧眼2.0」的核心。
對於使用者來說,可能最直觀的感受主要有:麒麟980將原來物體識別能力,從輪廓,擴充套件到物體姿態和形狀細節;實時影象處理,從圖片升級為視訊;實時影象智慧分割能力,從粗略到精準。
艾偉接受採訪時表示,華為希望將麒麟980的融合能力通過開放架構提供給更多開發者,包括Hi AI Foundation、Kirin AR DDK、Kirin Camera DDK等,將麒麟980的AI運算元、人體骨架姿態預估及跟蹤、前端物體識別和更好的成像能力等賦能開發者,建立更加豐富的AI生態。艾偉透露,在過去一年中,搭載麒麟970的華為AI智慧手機全球出貨量超過數千萬臺,這為AI開發者奠定了非常好的基礎,希望Mate 20發佈會後,會有開發者站出來,推出一個屬於自己的「嚇死人的創新應用」。
麒麟980支援Caffe、Tensorflow、Tensorflow Lite等主流框架,具有強大的深度學習框架相容性;提供了離線編譯、線上編譯、8bit量化等一系列完整工具鏈,既可以大大降低端側模型部署的工程難度,也能利用NPU差異化優勢發揮出最強算力; 支援CPU、GPU、NPU、DSP等的異構計算,方便深度學習演算法在麒麟980的自動靈活排程執行。
偽基站識別技術覆蓋2G至4G網路
在華為的傳統強項通訊方面,麒麟980率先支援LTECat.21,支援業界最快的下行1.4Gbps速率,更靈活的應對全球不同運營商的頻段組合,為使用者提供在不同的運營商網路下的高速體驗。
華為還宣佈麒麟980與5G晶片Balong 5000相結合,提供5G手機解決方案。
實時線上類應用尤其線上大型遊戲,對行動通訊網路的訊號強弱的感知非常敏感,海思半導體團隊深度挖掘高鐵、地鐵、高速公路、密集商業區等全場景下影響遊戲體驗的通訊問題,100多位深度遊戲玩家,在全球50個重點城市,測試30000多小時,找到了行動通訊下的遊戲體驗的問題所在,並進行了專項優化,有效降低了遊戲時延,減少了遊戲卡頓,行動網路下的遊戲表現更穩定。
此外,麒麟980配套使用的手機WiFi晶片Hi1103,率先支援160MHz頻寬,理論峰值下載速率可達1.7Gbps,是業界同期水平的1.7倍。同時,Hi1103支援業界領先的L1+L5雙頻GPS超精準定位,L5頻段下定位精度提升10倍,有效改善手機定位精準度。
當前,偽基站攻擊方式出現了新升級,不僅可通過簡訊嗅探、監聽使用者的正常通訊,還可以充當使用者和真實基站之間的「中間人」,將使用者資訊通過偽終端傳遞給真實基站,讓使用者在不知情的情況下,遭受資訊保安的威脅,甚至帶來財產損失。
麒麟980在使用者通訊聯接安全上下足了功夫,針對新出現的偽基站攻擊方式,進一步在晶片層面增加了安全機制,全面升級了識別2G偽基站的技術,同時率先支援識別4G偽基站,提升使用者在行動通訊網路下的安全能力,大大降低了受詐騙的概率。
10月16日Mate系列將全球首發
過去十年間,華為研發累積投入達3940億元,僅2017年研發投入就達896億元,佔比公司營收的14.9%,超過蘋果,位列全球研發投入排名第六位。目前,華為員工有18萬名,其中8萬名都是研發人員。2017年向歐盟申請專利高達2398項,位列全球第一。
麒麟晶片就是這種堅持重技術投入的典型收穫。堅定的使用自家晶片,倒逼麒麟晶片業務堅持瞄準世界一流技術,超前規劃,纔有了今天在華為手機在釋出節奏、產品規劃、AI創新上的步步領先。這些成績背後,是華為長達27年的晶片鉅額投入,三代華為人為此堅守與奮鬥。
此次麒麟980的釋出,無疑是華為多年投入與積累的又一次開花結果,要知道,臺積電的7nm工藝也將成為蘋果A12和高通驍龍855的選擇。其中,驍龍855的亮相至少要等到年底,首發機型上市則要到2019春季。也就是說,從Mate 20釋出到2019春季,麒麟980將是Android陣營唯一的7nm SoC。
昨天,華為舉辦的「華為P20系列手機創作的影像藝術展」上,官方再次強調,首款搭載麒麟980晶片的手機就是10月16日即將釋出的華為全新旗艦Mate20系列,屆時我們也會第一時間為大家帶來詳細報道,敬請關注。