在浙江烏鎮,全球矚目的2024年世界互聯網大會盛大啟幕,會上傳來了一則振奮人心的消息:騰訊憑借其卓越的創新成就,榮獲了大會新設獎項——杰出貢獻獎之創新突破類。這一榮譽不僅彰顯了騰訊在全球互聯網領域的影響力,更是對其不懈探索與創新精神的肯定。
不僅如此,騰訊Angel機器學習平臺也在本次大會上大放異彩,一舉奪得本年度世界互聯網大會領先科技獎。據悉,該獎項被譽為科技界的頂尖榮譽,從270個申報項目中脫穎而出,僅有20個項目獲獎,騰訊Angel機器學習平臺的實力由此可見一斑。
評選委員會對騰訊Angel機器學習平臺給予了高度評價,指出其成功攻克了萬億級模型分布式訓練和推理以及大規模應用部署等世界級難題。這一突破主要體現在通信、效率和規模三個方面。
在通信方面,騰訊自研的RDMA網絡實現了集群的高速互聯,單節點帶寬高達3.2T,相比同類領先產品,性能提升了30%,成本則降低了70%。這一技術的突破,為大規模模型訓練提供了堅實的通信基礎。
在效率方面,騰訊自研了訓練/推理框架,并創新性地提出了顯存加主存的一體化機制,實現了多維并行和算子優化。這一框架的推出,使得訓練性能相比開源框架提升了2.6倍,推理速度也提升了2.3倍,極大地提高了模型訓練和推理的效率。
在規模方面,騰訊Angel機器學習平臺實現了單任務萬卡的線性擴展,GPU集群加速比從50%提升至99%,這一突破使得大規模模型訓練成為可能,進一步推動了人工智能技術的發展。
那么,騰訊Angel機器學習平臺究竟是做什么的呢?簡單來說,它就像一個強大的“數據加工廠”。當你手握一堆雜亂無章的數據時,只需將這個“原材料”交給Angel機器學習平臺,它就能通過清洗、訓練、加工等一系列工序,將這些數據轉化為一個功能強大的大模型。
在整個過程中,底層由GPU、云服務器等計算硬件提供算力支持,中層則是騰訊Angel機器學習平臺這一“加工廠”,負責處理數據、開發算法和執行訓練任務,而上層則是經過訓練后的大模型,可以應用于各種場景,為人們的生活帶來便利。