阿里巴巴即將邁出重大一步,據新浪科技透露,公司內部消息人士證實,今晚,阿里將全面開放其先進的視頻生成模型——通義萬相2.1。
自今年1月升級至2.1版本以來,通義萬相在視頻和圖像生成能力上實現了顯著提升。這一升級不僅鞏固了阿里巴巴在AI領域的領先地位,也為用戶帶來了更為豐富的創作體驗。
在視頻生成領域,通義萬相2.1憑借自研的高效VAE和DiT架構,顯著增強了時空上下文建模能力。該模型能夠支持無限長的1080P視頻高效編解碼,并首次實現了中文文字視頻生成功能,這一突破使其在VBench榜單上榮登榜首。
通義萬相2.1的視頻生成功能不僅限于中文,同樣支持英文視頻的一鍵藝術字生成。該模型還提供了豐富的視頻特效選項,如過渡效果、粒子效果及模擬效果等,極大地增強了視頻的視覺表現力。該模型還能實現復雜的運鏡效果,并能精準還原真實世界的物理規律,如雨滴落在傘面上的水花濺起等。
在圖像生成方面,通義萬相2.1同樣表現出色。無論是插畫設計、涂鴉作畫,還是局部重繪,該模型都能輕松應對,為用戶提供了前所未有的創作自由度。同時,其短片創作和配樂生成功能也為用戶帶來了全新的創作體驗。
回顧去年9月,通義萬相已宣布支持文生視頻和圖生視頻等功能,這些功能的推出標志著阿里巴巴在AI視頻生成領域的重大突破。而此次全面開源通義萬相2.1,無疑將進一步推動AI視頻生成技術的發展和應用。
對于廣大創作者而言,通義萬相2.1的全面開源無疑是一個巨大的福音。他們可以利用這一先進的模型,輕松實現自己的創意和想法,創作出更多令人驚嘆的作品。同時,這一舉措也將為AI視頻生成領域注入新的活力,推動該領域不斷向前發展。
通義萬相2.1的全面開源也將為學術界和工業界提供更多的研究資源和應用機會。研究人員可以利用這一模型進行更深入的研究和探索,推動AI技術的不斷創新和發展。而企業則可以利用這一模型開發更多的應用場景和產品,為用戶提供更為豐富和多樣的服務。
總的來說,阿里巴巴全面開源通義萬相2.1是一個具有里程碑意義的舉措。這一舉措不僅將推動AI視頻生成技術的發展和應用,還將為創作者、研究人員和企業提供更多的機會和資源。我們有理由相信,在不久的將來,AI視頻生成技術將在各個領域發揮更為重要的作用。