近期,騰訊在人工智能領域迎來了一位重量級新成員。據知情人士透露,前微軟亞洲研究院視覺計算組的首席研究員胡瀚,已正式加入騰訊,他將負責多模態大模型的研發工作,接替了此前離職的騰訊混元大模型技術負責人劉威。
劉威的離職發生在去年11月,作為騰訊的杰出科學家和混元大模型技術團隊的核心成員,他的離開無疑引起了業界的廣泛關注。而胡瀚的加入,則被視為騰訊在人工智能領域持續深耕的重要一步。
胡瀚的學術背景深厚,他于2008年獲得清華大學本科學位,并在2014年取得清華大學博士學位。自2016年12月起,他一直在微軟亞洲研究院視覺計算組擔任研究員,積累了豐富的研究經驗。在計算機視覺領域,胡瀚是公認的重要研究者,他曾參與撰寫了一篇具有重要影響力的論文——《Swin Transformer: Hierarchical Vision Transformer using Shifted Windows》。
這篇論文提出的Swin Transformer模型,在性能上超越了DeiT、ViT和EfficientNet等主流網絡架構,成為了計算機視覺領域的新標桿。它替代了傳統的CNN架構,成為了眾多神經網絡和機器學習模型中的基礎結構,即backbone。
騰訊在人工智能領域的布局一直備受矚目。去年9月,騰訊正式發布了新一代大模型——騰訊混元Turbo。這款模型采用了MoE架構,相比上一代產品,在推理效率上提升了100%,推理成本則降低了50%。這一成果不僅展示了騰訊在人工智能領域的強大實力,也為行業樹立了新的標桿。
而在去年12月,騰訊又宣布了混元大模型的又一重要進展——上線并開源了文生視頻能力。這款模型參數量達到130億,支持中英文雙語輸入,為視頻創作和內容生成提供了全新的解決方案。