在科技領域迎來新突破之際,智元機器人公司宣布了一項重大創新成果——智元啟元大模型(Genie Operator-1),這一消息由知名科技極客“稚暉君”的創業項目正式揭曉。
智元啟元大模型的核心在于其革命性的Vision-Language-Latent-Action(ViLLA)架構,這一架構巧妙融合了VLM(多模態大模型)與MoE(混合專家)技術,使得機器人能夠通過觀察人類視頻進行學習,并在小樣本條件下迅速適應新任務。這一技術的實現,不僅大幅降低了具身智能的應用門檻,還成功應用于智元的多款機器人產品中。
在五種不同復雜度的任務測試中,GO-1大模型展現了其卓越的性能。與現有最優模型相比,GO-1的平均成功率提高了32%,從46%躍升至78%。特別是在“倒水”、“清理桌面”和“補充飲料”等具體任務中,GO-1的表現尤為搶眼。
智元團隊還針對ViLLA架構中的Latent Planner進行了專項驗證。實驗結果顯示,引入Latent Planner后,任務成功率進一步提升了12%,從66%增長到78%。
GO-1大模型之所以能夠實現如此顯著的性能提升,得益于其強大的學習能力。該模型結合了互聯網視頻和真實人類示范數據,使得機器人能夠更好地理解人類行為,從而提供更加貼心的服務。同時,GO-1還具備出色的泛化能力,能夠在極少甚至零樣本的情況下適應新場景和新任務,極大地降低了具身模型的使用難度和后訓練成本。
更令人矚目的是,GO-1大模型作為一款通用機器人策略模型,能夠輕松遷移至不同形態的機器人上,實現快速適配和群體升智。這一特性使得GO-1成為了一款極具潛力的通用具身基座模型。
在實際應用中,GO-1大模型展現出了其持續進化的能力。通過智元提供的數據回流系統,GO-1能夠從實際執行任務中遇到的問題數據中不斷學習和進化,實現越用越聰明的目標。
智元機器人的創始人之一彭志輝(稚暉君)曾以“華為天才少年計劃”最高檔年薪201萬元加入華為團隊,從事AI芯片和算法研究工作。2022年年底,他從華為離職,并于2023年2月聯合創立了智元機器人公司。