近日,人工智能領域的大模型創新者智譜公司宣布了一項重要進展,正式推出了其2025年開源計劃的首個里程碑產品——CogView4,這是一款開創性的開源文生圖模型,尤為引人注目的是,它首次實現了對漢字生成的支持。
CogView4在業界權威的DPG-Bench基準測試中脫穎而出,綜合評分位居榜首,標志著在開源文生圖模型領域達到了新的技術高峰(SOTA)。尤為該模型遵循Apache 2.0協議,這在圖像生成模型中是前所未有的。
智譜公司在GitHub平臺上分享了CogView-4模型的diffusers版本,這一版本配備了高達60億的參數,不僅支持中文輸入,還能直接將中文文本轉化為圖像,極大地拓寬了文生圖技術的應用場景。
智譜公司還提供了詳盡的技術文檔和示例代碼,以幫助開發者更好地理解和利用CogView4模型。這一舉措無疑將加速文生圖技術在中文環境下的普及和應用。
對于對人工智能和文生圖技術感興趣的開發者而言,CogView4無疑是一個不可多得的資源。感興趣的朋友可以通過以下開源地址獲取更多信息: