一款智能駕駛AI芯片的設(shè)計與制造流程
隨著智能駕駛和智能座艙時代到來以及AI技術(shù)的興起,汽車智能化成為了當前全球各個企業(yè)的目標和需求導向,自動駕駛和智能座艙在當前和未來的汽車開發(fā)和應(yīng)用場景中備受關(guān)注,這對AI芯片需求量大大增加,也對當前AI芯片及芯片廠商提出更高挑戰(zhàn)。在自動駕駛和智能座艙領(lǐng)域,目前英偉達、英特爾、德州儀器等不少芯片國際巨頭公司已布局良久。在此背景下,國產(chǎn)AI芯片公司如何突破國外技術(shù)封鎖?本文從國產(chǎn)芯片新星黑芝麻智能關(guān)于智能駕駛AI芯片的設(shè)計及制造流程來看如何實現(xiàn)彎道超車。
所謂AI芯片,神經(jīng)網(wǎng)絡(luò)加速器是其必不可少的一部分,目前所有的神經(jīng)網(wǎng)絡(luò)算法在硬件層面最消耗計算資源的就是乘和累加運算,即卷積,分解到硬件就是MAC(Multiply Accumulate)單元。通過這個下面公式可以說明MAC運算指令和 AI 算力之間的關(guān)系。
上面就是一個卷積,第二個等號右邊每個括號里的系數(shù)構(gòu)成的序列 (14,34,14,4),實際上就是序列 (2,4) 和 (7,3,1) 的卷積。所謂AI算力就是每秒執(zhí)行多少萬億次指令,這些指令通常就是MAC運算的指令。
AI芯片的核心就是MAC運算單元,流程就是從內(nèi)存中讀取訓練好的模型的濾波權(quán)重值和輸入數(shù)據(jù),兩者相乘,然后重復這個流程并將乘積累加,再寫入內(nèi)存。
設(shè)計一款數(shù)字芯片,流程基本上是確定市場定位、確定性能與功能目標即設(shè)計規(guī)格參數(shù)、架構(gòu)與算法設(shè)計、任務(wù)劃分、購買IP、RTL編碼與功能驗證即RTL仿真、綜合門級仿真、靜態(tài)時序分析與仿真。這是前端工序,后端是RTL轉(zhuǎn)門級網(wǎng)表文件、數(shù)據(jù)導入、布局規(guī)劃、單元布局、時鐘綜合樹、布線、物理驗證、版圖文件即GDSII交付晶圓代工廠。
圖片 圖1 芯片設(shè)計前端流程
圖2 芯片設(shè)計后端流程
也可以分為三級,第一級行為級(Behavior Level):通過行為級算法描述數(shù)字系統(tǒng)。也就是邏輯構(gòu)思,人腦的思維流程。這一階段主要工具為C/C++/Matlab,熟悉這些工具的人很多,很好找。第二級寄存器傳輸級(Register Transfer Level):在寄存器傳輸級,通過寄存器之間的數(shù)據(jù)傳輸進行電路功能設(shè)計,例如有限狀態(tài)機。工具是VHDL/Verilog/System Verilog,熟悉這些工具的人很少,這要求既要懂上層的邏輯結(jié)構(gòu),也要懂下層的電路實現(xiàn)。第三級門級(Gate level):數(shù)字系統(tǒng)按門級(AND,OR,NOT,NAND等等…)描述。通常不會進行門級設(shè)計,門級網(wǎng)表一般是通過邏輯綜合的輸出。RTL可以用Verilog或VHDL描述。實際上還有更細分的系統(tǒng)級(System Level)或功能模塊級(Functional Model Level)。
芯片制造流程
了解上述芯片軟件設(shè)計之后,大家就會知道制作出一張芯片難點甚多,尤其在設(shè)計以及細節(jié)的把控上都是我國芯片被卡脖子的地方。對于芯片制造我們需要了解芯片的上下游,芯片的制造可以理解成點石成金的過程,只不過此處的石是硅石,其材料主要是硅。其中最重要的是第1步二氧化硅到硅的過程,所以造芯片的第1步就是要把二氧化硅還原成硅錠,從目前所使用的工藝來看,硅錠圓形橫截面的直徑為200毫米。在保留硅錠的各種特性不變的情況下增加橫截面的面積是具有相當大難度的。在經(jīng)過提成,去拉法等獲得一根長長的硅棒,然后經(jīng)過切割,切片越薄,用料越省,自然可以生產(chǎn)的處理器芯片就更多。切片還要鏡面精加工的處理來確保表面絕對光滑,之后檢查是否有扭曲或其它問題。這一步的質(zhì)量檢驗尤為重要,它直接決定了成品芯片的質(zhì)量。研磨等制成像光盤一樣的硅片,在送往晶圓廠通過光刻和石刻雕刻出晶體管的物理結(jié)構(gòu)。光刻是芯片制造過程中工藝非常重要且復雜的一個步驟,光刻蝕過程就是使用一定波長的光在感光層中刻出相應(yīng)的刻痕,由此改變該處材料的化學特性。這項技術(shù)對于所用光的波長要求極為嚴格,需要使用短波長的紫外線和大曲率的透鏡。每一步刻蝕都是一個復雜精細的過程。設(shè)計每一步過程所需要的數(shù)據(jù)量都可以用10GB單位來計量。在殘留的感光層物質(zhì)被去除之后,剩下的就是充滿的溝壑的二氧化硅層以及暴露出來的在該層下方的硅層。感光層同時還要被短波長光線透過掩??涛g。再經(jīng)過一部刻蝕,并通過離子注入和覆膜等手段賦予其電特性,摻入的物質(zhì)原子進入硅原子之間的空隙,彼此之間發(fā)生原子力的作用,從而使得硅原料具有半導體的特性,在其上刻劃代表著各種邏輯功能的晶體管電路。形成一張芯片,最后將它們切割分離并進行封裝測試就完成了一個個芯片的制造。
圖 3 黑芝麻智能駕駛芯片制造的基本過程
上圖是以黑芝麻智能駕駛芯片制造流程為例,在制造工藝流程方面簡單總結(jié)為:
晶圓制造與加工:
晶圓制造:融化,提純,拉晶獲得單晶硅硅棒,對硅棒進行切片,研磨等獲得晶圓。
圖 4 晶圓圖片
晶圓加工:光刻改變晶圓材料的化學特性,上述設(shè)計的電路制作成一片片光罩,使用強光透過光罩后照在晶圓上,在曝光過程結(jié)束后加入顯影液,正光刻膠的感光區(qū)、負光刻膠的非感光區(qū),會溶解于顯影液中。這一步完成后,光刻膠層中的圖形就可以顯現(xiàn)出來,顯影工序使將在曝光過程中形成的隱性圖形成為光刻膠在與不在的顯性圖形。顯影中進行的是選擇性溶解的過程,最重要的是曝光區(qū)和未曝光區(qū)之間溶解率的比值(DR)。下一步是刻蝕和離子注入,刻蝕對于器件的電學性能十分重要。如果刻蝕過程中出現(xiàn)失誤,將造成難以恢復的硅片報廢,因此必須進行嚴格的工藝流程控制。半導體器件的每一層都會經(jīng)歷多個刻蝕步驟,離子注入是一種將特定離子在電場里加速,然后嵌入到另一固體材料之中的技術(shù)手段。重復這些步驟,然后就出現(xiàn)了一個多層立體架構(gòu),這就是目前使用的芯片的最初狀態(tài)了。
芯片封裝:
芯片封裝是將Foundry廠生產(chǎn)的晶圓切割成一個個小的晶片,通過不同的封裝技術(shù)對晶片進行塑封封裝從而得到我們看到的芯片。
芯片測試:
芯片測試包括:良率測試,功能測試,性能測試,可靠性測試等。
芯片制造最近幾年的變化隨著半導體行業(yè)技術(shù)發(fā)展,工藝從微米進入納米時代,根據(jù)行業(yè)數(shù)據(jù)來看,業(yè)界最先進的工藝制程5nm已經(jīng)在2020年量產(chǎn),3nm的已經(jīng)進入試產(chǎn)階段。
圖 4 1988-2020年芯片工藝制程變化圖
而且隨著CMOS工藝的演進,柵氧厚度也要不斷縮小。薄到一定厚度的柵氧就不再是理想的絕緣體,會出現(xiàn)明顯的泄漏。在40nm進入28nm的時候,業(yè)界開始普遍采用HKMG技術(shù)。技術(shù)路線分為Gate-first和Gate-last。
圖 5 40nm-28nm芯片工藝變化
工藝進入到16nm/14nm的時候,晶體管結(jié)構(gòu)從2D變?yōu)?D FinFET能夠帶來更好的leakage current控制和更好的性能,成為先進工藝節(jié)點必選的晶體管結(jié)構(gòu)。
圖 6 16nm/14nm芯片晶體管結(jié)構(gòu)變化
而目前最先進的量產(chǎn)工藝主要是7nm/5nm,更小的pitch讓EUV技術(shù)越來越成為主流TSMC從N7+開始采用EUV,最初的7nm工藝(N7/N7P)仍然采用DUV,三星則是在其第一代7nm工藝上就采用了EUV技術(shù)。
圖 7 不同代芯片工藝技術(shù)變化
GAA(Gate All Around)的名稱來自晶體管結(jié)構(gòu),這個全新設(shè)計將柵極完全包裹在通道周圍,可實現(xiàn)更好的控制。三星相對TSMC來說,會更早采用GAA技術(shù)。TSMC則會從2nm開始采用GAA,這是未來的趨勢之一。
半導體工藝的不斷進步,會帶來PPA(Performance Power Area)的提升,進而提升芯片以及系統(tǒng)產(chǎn)品的關(guān)鍵指標和用戶體驗,這對算力要求超高的智能駕駛芯片來說,有著決定性的影響。
對于智能輔助駕駛和智能駕駛車輛來說,車規(guī)級芯片需要復雜SOC芯片兼具高算力,高集成度,高可靠性的要求,同時需要控制芯片體積和功耗,當然還要考慮芯片發(fā)熱情況。
圖 8 智能駕駛芯片示意圖
黑芝麻智能從核心IP為切入點,打造國產(chǎn)性能最強自動駕駛計算芯片?;趦纱蠛诵淖匝蠭P——NeuralIQISP 圖像信號處理器及高性能深度神經(jīng)網(wǎng)絡(luò)算法平臺DynamAI NN引擎,黑芝麻智能已發(fā)布多款芯片產(chǎn)品:
2019年8月
黑芝麻智能第一顆車規(guī)級智能駕駛芯片華山一號A500在國內(nèi)首發(fā),算力達5-10TOPS
2020年6月
第二代芯片華山二號A1000發(fā)布,算力達40-70TOPS,是唯一可以支持L2+自動駕駛的國產(chǎn)芯片
2021年4月
國產(chǎn)車規(guī)大算力芯片再升級,黑芝麻智能發(fā)布華山二號A1000 Pro。A1000 Pro于同年7月流片成功,算力達到驚人的106-196TOPS,單顆芯片可以支持高級別自動駕駛功能,從泊車、城市內(nèi)部到高速場景的無縫銜接
華山二號A1000自動駕駛芯片:國內(nèi)首款基于成熟車規(guī)功能安全體系打造自動駕駛芯片。該芯片通過了ISO26262功能安全流程ASIL D認證及產(chǎn)品ASIL B Ready認證、可以配合客戶實現(xiàn)系統(tǒng)級ASIL D產(chǎn)品。作為已量產(chǎn)的高性能自動駕駛芯片華山二號A1000L自動駕駛感知芯片,目前是國內(nèi)第一個同時符合汽車功能安全和汽車可靠性權(quán)威認證的L2.5等級自動駕駛感知芯片。
華山二號A1000 Pro作為國內(nèi)算力最高的自動駕駛計算芯片,該芯片采用業(yè)界創(chuàng)新先進封裝工藝集成多個核心,解決16nm工藝支持超大規(guī)模深度學習引擎難題,基于內(nèi)部多核心建立高速通信通路,大幅提高數(shù)據(jù)傳輸效率,支持黑芝麻智能最新的FAD Platform,適配多種標準協(xié)議和操作系統(tǒng),提供軟件全生命周期的管理,在A1000Pro系統(tǒng)中,任務(wù)可以在多個子系統(tǒng)之間動態(tài)遷移。
華山二號A2000是國內(nèi)首個250T大算力芯片:頂尖7納米工藝、國產(chǎn)自主知識產(chǎn)權(quán)核心IP、滿足ASIL B級別的安全認證標準。
從黑芝麻智能車規(guī)級芯片來看,車規(guī)級芯片需要具備以下特點:
工作溫度范圍較大:
-40°-150°,取決于控制器的位置,一般在發(fā)動機艙的溫度范圍是-40°-150°,車身其它位置大概是-40°-105°,相比于其它產(chǎn)品溫度范圍要求較大。
物理化學特性需要穩(wěn)定:
一般車輛工作環(huán)境變化較大,特別是環(huán)境比較差的地方,一般需要考慮濕度、粉塵、鹽堿、霉變、高低溫交替、震動、沖擊等因素對控制器的影響。
抗干擾性:
由于車輛上面的電子器件,傳感器及各種通信線束,這對車規(guī)級芯片的ESD靜電、EFT群脈沖、RS傳導輻射、EMC、EMI等要求都是非常高。
壽命長:
與手機相比,車規(guī)級的芯片一般要求具備較長的工作壽命,一般為15年或50萬公里的設(shè)計壽命。
故障率:
車規(guī)級芯片的故障率需要達到PPM-PPB-0,故障率相比其它產(chǎn)品要求較嚴格。
供貨周期:
目前車規(guī)級芯片,考慮到車型的生命周期及售后服務(wù)等因素,一般都是10年,供貨周期長。
產(chǎn)品一致性:
由于車輛是大量批量生產(chǎn),且影響生命安全,因此在芯片一致性方面,無論是產(chǎn)線認證,產(chǎn)線一致性,原材料/生產(chǎn)/封裝溯源等要求都是非常嚴格。
除上述這些以外,還需要滿足質(zhì)量管理標準,可靠性標準,功能安全標準,環(huán)保標準等等。作為車規(guī)級芯片,要求其具備安全架構(gòu)及安全流程的完整設(shè)計和相應(yīng)的安全認證。
圖 9 黑芝麻智能車規(guī)級芯片安全架構(gòu)
圖 10 黑芝麻智能車規(guī)級芯片安全流程
圖 11 黑芝麻智能車規(guī)級芯片A1000安全認證
以黑芝麻智能芯片A1000為例,同時遵循ISO-26262 安全標準設(shè)計,設(shè)計人員通過ISO-26262安全設(shè)計生產(chǎn)培訓。專門的服務(wù)器,用于存儲設(shè)計文檔及過程數(shù)據(jù),所有流程可追溯。
圖 12 黑芝麻智能芯片A1000開發(fā)認證證書
與傳統(tǒng)車規(guī)級芯片相比,智能駕駛芯片需要具備更多的性能要求。同時需要支持各類型傳感器接口;隨著智能駕駛開發(fā)軟件的多樣化,要求智能駕駛芯片需要支持開放的軟件與工具鏈,支持高安全操作系統(tǒng)、自動駕駛框架、 Autosar 、復雜算法等;對信息安全,功能安全,實時性,確定性有著高安全高可靠性要求;同時也需要考慮性能、成本和功耗的平衡,支持量產(chǎn)化的車載散熱與布局設(shè)計;支持平臺化可擴展,滿足車廠高中低配需求。
圖 13 黑芝麻智能芯片A1000自動駕駛芯片特點
圖 14 黑芝麻智能自動駕駛計算芯片產(chǎn)品路線
芯片制造完成后,還需要封裝和測試,才能最終拿到芯片。從確定市場定位到最終量產(chǎn),數(shù)字類芯片大概周期要3-4年,用在車上都要是5-6年后了。所以一開始的市場定位要考慮到4-10年后的市場需求,而市場需求通常很難預(yù)測,其中的風險也不小,如手機廠商,我們看手機支持的功能,只需要看手機芯片廠商宣傳的功能即可。以此類推,面對未來的5-10年,智能駕駛車輛如何發(fā)展,我們可以參考黑芝麻智能給出的解決方案。
開發(fā)工具鏈是否完善是自動駕駛企業(yè)開發(fā)的難點之一,黑芝麻智能將其作為黑芝麻芯片易用性的重要指標。配合華山系列自動駕駛芯片,黑芝麻智能還發(fā)布了山海人工智能開發(fā)平臺。它擁有50多種AI參考模型庫轉(zhuǎn)換用例,降低客戶的算法開發(fā)門檻;能夠?qū)崿F(xiàn)QAT和訓練后量化的綜合優(yōu)化,保障算法模型精度;支持動態(tài)異構(gòu)多核任務(wù)分配,同時還支持客戶自定義開發(fā),完善的工具鏈開發(fā)包及應(yīng)用支持,能夠助力客戶快速移植模型和部署落地的一體化流程。
現(xiàn)在新車的迭代周期越來越短。原因之一,是因為車里面更多的創(chuàng)新是集中在電子和軟件部分,就像原來電子行業(yè)的發(fā)展,因此現(xiàn)在看到很有趣的現(xiàn)象是:汽車行業(yè)的發(fā)展規(guī)律,開始越來越像電子行業(yè)的發(fā)展趨勢。
在PC時代和手機時代,當應(yīng)用和軟件在大規(guī)模發(fā)展的前夕都是硬件先行,因為硬件的迭代周期長,軟件的迭代周期短,所以在軟件的快速迭代和擴展功能性能的前提,是需要先把硬件的性能和算力備足。汽車行業(yè)現(xiàn)在開始進入到的階段,恰恰是剛剛提到的:汽車行業(yè)開始電子化甚至是消費電子化趨勢的一個很重要的體現(xiàn)。
智能駕駛汽車未來對算力的要求,正因為自動駕駛的發(fā)展、汽車智能化的發(fā)展,未來軟件應(yīng)用的擴展空間是無限的。所以,他們第一步是希望能留有足夠多的硬件和算力的冗余,才能給軟件的算法和創(chuàng)新留足夠大的空間,這也是為什么現(xiàn)在大家都先要求算力?,F(xiàn)在大家都是以算力為衡量性能的標準,當然算力最后體現(xiàn)在滿足客戶應(yīng)用的過程中以及軟件的優(yōu)化程度,事實上,一枚芯片有 PPA 三個指標:功耗 Power,性能 Performance,面積 Area。功耗是排第一的,其次是性能,面積則相當于成本,黑芝麻智能推出的華山二號 A1000 Pro,在INT8的算力為 106 TOPS,INT4 的算力達到了 196 TOPS,典型功耗 25W,也意味著整體能效比高達 8 TOPS/W,而目前行業(yè)中主流的幾家智能駕駛芯片Mobileye EyeQ5是 24 TOPS,英偉達 Xavier是 30 TOPS,英偉達 Orin的高算力版本 Orin X 是 200 TOPS,華為 MDC是 48 - 160 TOPS,特斯拉 FSD是144 TOPS,就黑芝麻智能芯片算力和能耗比來說,不輸任何一家。
截止目前,黑芝麻智能已經(jīng)與一汽、上汽、博世、中科創(chuàng)達、亞太等在 L2/3 級 ADAS 和自動駕駛感知系統(tǒng)解決方案上展開商業(yè)合作,其中與一汽南京聯(lián)合打造的紅旗 「芯算一體」自動駕駛平臺,將服務(wù)紅旗后續(xù)量產(chǎn)車型。在未來,黑芝麻智能將與業(yè)內(nèi)眾芯片企業(yè)、汽車零部件供應(yīng)商及各大OEM一起,通過智能駕駛技術(shù)的變革改變?nèi)祟惖纳罘绞健?/p>













































