智快網 - 新科技與新能源行業網絡媒體

          李飛飛團隊s1模型揭秘:基于阿里Qwen,50美元云費用挑戰AI推理巔峰?

             發布時間:2025-02-06 22:55 作者:唐云澤

          近期,李飛飛研究團隊宣布了一項引人注目的成就:他們成功以極低的云計算成本——不到50美元,訓練出了一款名為s1的人工智能推理模型。該模型在數學解題與編程能力測試中,展現出了與業界頂尖模型,如OpenAI的o1和DeepSeek的R1相媲美的表現。

          然而,這一成果很快引發了外界的質疑。有網友指出,s1模型并非完全從零開始訓練,而是基于阿里云的通義千問(Qwen)模型進行了進一步開發。為了核實這一信息,新浪科技聯系了阿里云方面,并得到了確認。

          阿里云方面詳細回應稱,s1模型是以阿里通義千問Qwen2.5-32B-Instruct開源模型為基礎,通過16塊H100 GPU進行26分鐘的監督微調后得到的。新模型s1-32B在數學及編碼能力測試中,取得了與o1和R1等尖端模型相當的效果,甚至在解決競賽數學問題上的表現,還超出了o1-preview模型27個百分點。

          據了解,s1團隊在創建該模型時,采用了“蒸餾”技術。這一技術的核心在于,通過訓練模型來學習另一個已有人工智能模型的答案,從而提取其推理能力。s1的論文指出,他們使用了一種稱為監督微調(SFT)的方法,利用相對較小的數據集來實施蒸餾。在SFT過程中,人工智能模型被明確指示在數據集中模仿特定的行為模式。

          值得注意的是,s1模型是基于阿里巴巴旗下中國人工智能實驗室Qwen提供的一款小型、現成的免費模型進行開發的。為了訓練s1,研究人員精心策劃了一個包含1000個問題及其答案的數據集,同時還參考了谷歌Gemini 2.0 Flash Thinking Experimental為每個答案提供的“思考”過程。

          此次s1模型的成功,不僅展示了低成本、高效率訓練人工智能模型的潛力,也引發了業界對于模型微調與蒸餾技術的進一步關注。這一成果有望為人工智能領域的發展帶來新的啟示和動力。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          国产三级久久精品三级| 538精品视频在线观看| 日韩精品无码一区二区视频| 精品亚洲国产成人| 久久精品中文字幕| 久久精品一区二区三区中文字幕| 日韩精品久久久久久免费| 自拍偷自拍亚洲精品播放| 99精品国产第一福利网站| 99久久久国产精品免费牛牛| 久久99久久99小草精品免视看| 国产精品成人观看视频国产奇米| 日韩蜜芽精品视频在线观看| 国产成人精品福利网站人| 久久99热精品这里久久精品| 久久99精品国产麻豆婷婷| 午夜精品成人毛片| 久久久国产精品福利免费 | 午夜天堂精品久久久久| 中文字幕精品亚洲无线码二区| 国产精品嫩草影院在线播放| 亚洲AV永久精品爱情岛论坛| 久久精品国产精品亜洲毛片| 午夜肉伦伦影院久久精品免费看国产一区二区三区 | 国产福利精品视频自拍| 亚洲精品国产av成拍色拍| 国产一区二区精品久久凹凸| 无码国模国产在线无码精品国产自在久国产 | 精品久久久久久中文字幕大豆网 | 国产午夜精品一区二区三区极品| 青娱分类视频精品免费2| 国产国拍精品亚洲AV片| 日韩精品视频在线播放| 99在线精品视频观看免费| 自拍偷自拍亚洲精品情侣| 国产精品偷伦视频免费观看了| 成人综合婷婷国产精品久久蜜臀 | 国产精品R级最新在线观看| 国产精品高清在线观看93| 日本一区二区三区精品视频| 精品国产一区二区麻豆|