近日,華為技術有限公司在人工智能領域的一項新專利引起了廣泛關注。據天眼查App透露,華為已正式公布了名為“人工智能模型的量化方法、處理系統和量化單元”的專利。
該專利的核心在于一種創新的量化方法,該方法通過量化單元來優化AI模型的內存占用。具體而言,量化單元會根據運行AI模型的計算設備中各個計算單元的處理粒度,靈活地將量化矩陣分割成多個適合不同計算單元處理的小塊,即分塊量化矩陣。這一步驟確保了每個計算單元都能高效處理其負責的部分。
進一步地,量化單元會對這些分塊量化矩陣進行量化處理,并將處理后的結果存儲在存儲器中。這一創新不僅減少了AI模型對內存資源的占用,還提升了整體的處理效率。值得注意的是,這里的量化矩陣可以涵蓋權重矩陣和激活矩陣,進一步拓寬了該方法的應用范圍。
尤為重要的是,華為的這一專利在量化過程中摒棄了傳統的基于張量級別進行離群值統計的方法。相反,它完全基于計算設備的各個計算單元的處理粒度進行量化,從而實現了對權重矩陣和激活矩陣的實時量化。這一轉變不僅簡化了量化流程,還提高了量化的準確性和效率。
業內人士指出,華為此次公布的專利無疑為人工智能模型的優化提供了新的思路。通過創新的量化方法,華為不僅解決了AI模型內存占用大的問題,還為AI模型的實時處理和高效運行奠定了堅實的基礎。這一專利的公布,無疑將推動人工智能技術在更多領域的應用和發展。