學術活動
信息工程學院學術講座:高效LLM加速器開發與模型推理的敏捷設計框架:挑戰與實踐
2024-12-27
點擊次數:時間:2024年12月27日
地點:校本部 新教二樓209教室
主講人:卓成 浙江大學 教授
主持人:邱柯妮 首都師范大學信息工程學院 教授
主講人簡介:卓成博士,浙江大學求是特聘教授。入選國家高層次人才計劃、IEEE電子設計自動化(CEDA)協會杰出講者和英國工程技術學會會士等。長期從事集成電路設計和設計自動化研究,發表Nature Communications、TCAD、EDL、DAC等期刊/會議論文200余篇,獲得領域旗艦會議ICCAD、ASPDAC、DAC等最佳論文獎/提名11次。擔任IEEE TCAD等多個EDA國際期刊編委、《計算機輔助設計與圖形學學報》領域編委、多個國際會議主席及ACM SIGDA華東分會主席。
主講內容簡介:大語言模型(LLM)的廣泛應用對加速器設計提出了前所未有的挑戰,包括高算力、高帶寬和能效優化的綜合需求。傳統芯片開發流程難以滿足快速迭代和多樣化模型推理場景的需求,亟需更敏捷的設計框架。本報告聚焦于高效LLM加速器開發的核心挑戰,探討跨層次分析和多目標優化的設計框架,為構建面向未來的敏捷加速器設計方法提供參考。