在今日盛大啟幕的全球開發者大會(GDC)舞臺上,阿里云魔搭社區宣布了一項令人矚目的成就——首次推出了兩款由階躍星辰最新開源的多模態模型。其中一款名為Step-Video-T2V,作為全球參數量最大的開源視頻生成模型,它擁有驚人的300億參數,為視頻創作領域帶來了前所未有的創新力量。另一款則是業界首款產品級開源語音交互模型Step-Audio,它的出現預示著語音交互技術將邁入一個全新的發展階段。
這兩款模型的發布,無疑為阿里云魔搭社區增添了濃墨重彩的一筆。作為中國最大的AI模型社區,魔搭社區一直致力于匯聚和分享最前沿的AI技術成果。截至目前,社區內已經上架了超過4萬個開源模型,涵蓋了LLM、對話、語音、文生圖、圖生視頻等多個熱門領域,為開發者們提供了一個豐富多樣的技術寶庫。
Step-Video-T2V模型的誕生,標志著視頻生成技術邁向了一個全新的高度。借助其強大的參數規模和先進的算法設計,用戶能夠輕松生成高質量、富有創意的視頻內容,極大地拓寬了視頻創作的邊界。而Step-Audio模型的出現,則讓語音交互技術更加貼近實際應用場景,為用戶提供了更加自然、流暢的交互體驗。
阿里云魔搭社區的這一舉措,不僅展示了其在AI技術領域的深厚積累和創新實力,也為全球開發者們提供了一個更加廣闊的學習和交流平臺。隨著這兩款開源模型的發布,相信會有更多的開發者加入到AI技術的研究和應用中來,共同推動人工智能技術的不斷發展和進步。
在未來的日子里,我們期待著阿里云魔搭社區能夠繼續秉持開放、共享的理念,為開發者們帶來更多優質、實用的AI技術和模型。同時,我們也期待著全球開發者們能夠攜手共進,共同探索人工智能技術的無限可能,為人類社會的進步和發展貢獻更多的智慧和力量。