執行現況與成果
高效能記憶體增強型神經網路之AI架構與電路開發
主持人
共同主持人
為導入台灣半導體技術於未來AI系統,本團隊聚焦於低訓練複雜度的記憶體增強型神經網路 (MANN) 研究,並進行電路、架構與演算法層面之設計技術協同優化,以開發高效能AI運算系統。本團隊的主要技術包括: 1) 基於非揮發性記憶體的高效能混合式記憶體內搜索架構,2) 基於MRAM元件的高效能記憶體內運算電路與測試技術,3) 適用於MANN的混合式AI運算架構設計。為此,我們提出三項子計畫進行技術開發,以達成下一代高效能AI運算系統的目標。
在本A世代半導體計畫架構下,子計畫一將著重於MANN前後端軟硬體協同優化與高效能混合式AI加速訓練晶片設計,提供完整針對MANN前端基於記憶體內運算 (IMC) 之資料特徵萃取之解決方案。子計畫二將著重於NVM-based高效能記憶體內搜索 (IMS) 電路中的演算法與架構開發,提供完整針對MANN後端向量相似度搜索之NVM-IMS的解決方案。子計畫三、四將著重於MRAM-based高效能記憶體內運算的電路設計與測試技術開發,提供完整針對MANN前端運算之MRAM-CIM的解決方案。
Parasitic-free stacked nanowires結合3D MTJ技術
劉致為教授團隊將高層數堆疊高遷移率通道之nanowires成果發表於 2021 年超大型積體電路技術研討會 (VLSI Symposia on Technology),並且獲選為Highlight Paper,其驅動電流為鍺/鍺矽三維電晶體之世界紀錄 (>4000 mA/mm @ VOV=VDS=0.5V) [1]。此成果榮獲國際頂尖期刊Nature Electronics報導於Research Highlight,也刊登於臺大校訊與NTU HIGHLIGHTS。
3D MTJ技術
劉致為教授團隊將自旋軌道力矩磁性穿隧接面成果發表於 2021 年超大型積體電路技術研討會 (VLSI Symposia on Technology) ,並且獲選為Highlight Paper,透過用鎢做多層擴散阻擋層,可以達到400C的熱穩定性,且使用鉈鎢自旋軌道力矩通道可提供高自旋霍爾角度,可以同時增加元件蝕刻的process window,並且可利用自旋轉移力矩 (STT) 達成零磁場轉換 [2]。
高效能及高運算解析度之記憶體內計算電路系統技術表現
劉宗德教授團隊透過解析Computing-in-memory (CIM) 之構成與運作機制之後發現,Memory Array和數位與類比轉換溝通界面之間存在許多冗餘的電路操作。因此子計畫二提出一個Unified CIM Network設計方法,利用協同設計與最佳化思維來設計新型的CIM Cell,該新型CIM Cell共集成了四種功能,1) 基本的Memory Read/Write, 2) 乘法-累加運算(Multiply-Accumulate, MAC),3) ADC的核心功能,以及4) 參考電壓 (Vref) 生成與SAR電容切換。透過此技術,CIM可免除使用獨立且成本高昂的ADC來將Bit‑Line上的MAC結果轉換成數位碼,取而帶之的是將ADC的運算拆解並融入Memory Array之中,藉此避免了大量的冗餘能量與面積消耗,最終提升CIM Macro層級達到383 TOPS/W的能源效率,此研究成果已在頂級期刊IEEE Journal of Solid-State Circuits (JSSC) 期刊發表 [3]。
高能源效率AI運算架構與演算法開發
吳安宇教授團隊所發表論文Trainable Energy-aware Pruning (T-EAP),榮獲2022 年IEEE AICAS (AI for Circuits and Systems) 最佳學生論文獎 (Best Student Paper Award) [4],本技術使用Georgia Tech團隊所開發的DNN+NeuroSim平台模擬的能源資訊,並利用此能耗資訊讓DNN在剪枝(pruning)的過程當中,針對能耗較大的權重進行剪枝,以達文獻中最佳準確率-能耗之效能。以T-EAP為基礎,本團隊進一步提出E-UPQ: Energy-Aware Unified Pruning-Quantization Framework,可訓練的參數在壓縮過程中進行可微分的剪枝/量化(quantization)共同搜索。相較於完整精度模型,本團隊所提出之CIM能源覺察壓縮技術使ResNet-18及VGG-16模型在CIM平台上運行之能源效率 (TOPS/W) 提升4倍,並已發表於 IEEE Journal on Emerging and Selected Topics in Circuits and Systems [5]。
Reference
[1] Y. -C. Liu et al., “Highly Stacked GeSi Nanosheets and Nanowires by Low-Temperature Epitaxy and Wet Etching,” in IEEE Transactions on Electron Devices, vol. 68, no. 12, pp. 6599-6604, 2021.
[2] Y. -J. Tsou et al., “Thermally Robust Perpendicular SOT-MTJ Memory Cells With STT-Assisted Field-Free Switching,” in IEEE Transactions on Electron Devices, vol. 68, no. 12, pp. 6623-6628, 2021. |
[3] C. -Y. Yao, T. -Y. Wu, H. -C. Liang, Y. -K. Chen and T. -T. Liu, “A Fully Bit-Flexible Computation in Memory Macro Using Multi-Functional Computing Bit Cell and Embedded Input Sparsity Sensing,” in IEEE Journal of Solid-State Circuits, 2023.
[4] C. -Y. Chang, Y. -C. Chuang, K. -C. Chou and A. -Y. Wu, “T-EAP: Trainable Energy-Aware Pruning for NVM-based Computing-in-Memory Architecture,” IEEE International Conference on Artificial Intelligence Circuits and Systems (AICAS), pp. 78-81, 2022.
[5] C. -Y. Chang, K. -C. Chou, Y. -C. Chuang and A. -Y. Wu, “E-UPQ: Energy-Aware Unified Pruning-Quantization Framework for CIM Architecture,” in IEEE Journal on Emerging and Selected Topics in Circuits and Systems, vol. 13, no. 1, pp. 21-32, 2023.