24小時聯系電話:18217114652、13661815404
中文
行業資訊
將人工智能融入低功耗芯片設計
將人工智能融入低功耗芯片設計
隨著對消耗更少功率的越來越小的電子設備的需求不斷增長,低功率芯片設計已經發揮了基本作用。越來越多地出現在嵌入式系統中的人工智能正在挑戰低功耗芯片設計人員,以整合更密集、更具創新性的架構和制造工藝。為了滿足功能性、可制造性、成本和可靠性等 AI 芯片要求,需要適當的功耗分析技術和工具。
低功耗設計
低功耗設計的目標是降低集成電路 (IC) 的整體動態和靜態功耗,這是實現下一代應用的關鍵方面。該過程涉及動態和靜態功耗的降低。動態功率包括開關和短路功率分析,而靜態功率主要包括漏電流分析。包含上述三個貢獻的功率方程如圖 1 所示。
圖 1:功率元件和方程
在 IC 制造工藝基于 90 nm 至 16 nm 技術的年代,設計人員的注意力集中在降低泄漏功率上,因為它比動態功率(10%)具有更大的權重(85% 至 95%)到 15%)。隨著隨后從 16 nm 過渡到 14 nm,功率方程發生了變化;泄漏功率得到了很好的控制,而動態功率則成為一個更重要的問題。這首先是由于從平面到 FinFET 晶體管架構的轉變,多柵極器件構建在襯底上,其中柵極放置在通道的兩側、三側或四側或環繞通道,形成一個雙門甚至多門 3D 結構。
未來幾年,隨著電子制造領域的不斷進步,7nm、5nm甚至3nm的制造工藝將再次凸顯泄漏功率的重要性。
人工智能的新挑戰
人工智能在電子應用中的日益廣泛使用帶來了新型的電源挑戰。性能、功耗和面積 (PPA) 范例仍然是設計人員要實現的目標。不同的是,隨著人工智能芯片的引入,在不犧牲功率的情況下最大化功率變得更加困難。今天,性能實際上受到功率的限制,并且很難在不擔心分散的熱量和熱管理的情況下向芯片的每個部分可靠地供電。
矢量的質量(定義為 SoC 在真實系統中工作時所看到的真實活動)對于動態功耗分析和優化至關重要。
“最大的問題是估計工作負載,特別是當 SoC 在現場運行時,在真實系統上,”新思科技設計集團的低功耗架構師兼研究員 Godwin Maben 說。“我們需要知道測量和優化動態功率的工作量。談到人工智能,沒有預定義的基準。我們需要識別這些工作負載,確保捕獲它們并盡早調試電源。”
低功耗設計意味著了解功耗對軟件開發、硬件設計和制造的影響。它不是單步操作,應該貫穿整個芯片設計過程,目的是降低整體動態和靜態功耗。
如圖 2 所示,設計和驗證方法分為五個主要階段:
靜態功耗驗證與探索
動態功率驗證和分析
軟件驅動的功耗分析
電源實現
登出
圖 2:設計和驗證階段
仿真的作用
提供有關 SoC 功耗的估計是一項艱巨的任務,這要求設計人員設置能夠盡可能忠實地再現真實工作條件的測試平臺。能夠滿足這些要求的最佳系統是仿真。
對 AI 芯片進行功耗分析需要合適的工具,能夠獲取和處理數百 GB 的數據,包括數萬億或數十億個時鐘周期。仿真系統內的功率分析有助于解決這個問題,因為它只能識別功率分析感興趣的窗口。
“人工智能芯片帶來了兩個新概念,”馬本說。“第一個是驗證調試具有挑戰性,因為它需要很長時間。第二個是如何開發應用軟件,可以在芯片啟動時準備好。這就是仿真和原型設計的概念出現的地方。”
由于其獨特的快速仿真架構、最先進的商用 FPGA 以及基于 FPGA 的仿真軟件的創新,Synopsys 的 ZeBu 服務器是業界最快的仿真系統, 其性能 是傳統仿真解決方案的2 倍。ZeBu 軟件為用戶提供了有價值的工具,例如快速編譯器、高級調試(包括與 Verdi 的本地集成)、仿真加速、混合仿真和功耗分析。
當應用程序在模擬器上運行時,它最終會被轉換為 SoC 的向量。然后可以使用這些向量來運行仿真,從而驗證仿真器中芯片的功能。仿真是獲得工作負載的合適平臺,因為它生成針對功耗分析優化的向量。如圖 3 所示,PrimePower RTL 使用 ZeBu EmPower 向量為設計人員提供有用的信息。
圖 3:概要軟件驅動的 SoC 活動
AI 芯片使用大量數學函數,主要是乘法和矩陣運算,由專用和優化的組合邏輯執行。
“當我們進入這些計算密集型應用程序時,設計師擔心的新概念是較低幾何結構的故障功率,”Maben 說。“毛刺功率占總功率的 25% 以上,我們知道毛刺功率意味著浪費功率。”
毛刺的數量與 SoC 執行的操作數量成正比,這使得毛刺成為 AI 加速器需要解決的重要問題。故障有兩種類型:慣性故障和運輸故障。慣性毛刺可以在架構上解決,而傳輸毛刺是由于通過邏輯單元的延遲導致邏輯門輸入處的不同到達時間。毛刺正在成為一個非常大的話題,因為它們很難優化,也很難衡量。
Synopsys 提供端到端 RTL 到門故障電源分析和優化解決方案。在 RTL 中,PrimePower RTL可以計算和報告每個層次結構的故障,它還可以指向生成最高級別故障的 RTL 源代碼行。所述 的PrimePower溶液 還提供對延遲/毛刺感知使用RTL仿真,并且可以執行使用零延遲門級仿真或定時感知仿真密切相關,以SPICE功率數毛刺功率分析矢量生成。