智快網 - 新科技與新能源行業網絡媒體

          微軟rStar-Math技術助力,小語言模型數學推理能力大飛躍!

             發布時間:2025-01-11 12:41 作者:顧雨柔

          微軟亞洲研究院的數學與人工智能研究團隊近日取得了一項新的技術突破,他們專為解決數學問題設計并開發了名為rStar-Math的技術。這項技術于1月10日通過官方博文正式對外公布。

          與微軟此前推出的Phi-4技術相比,rStar-Math采用了蒙特卡洛樹搜索(Monte Carlo Tree Search)進行推理。這種方法模擬了人類逐步解決問題的思維方式,通過將復雜問題分解成更小的部分,逐步求解,從而提高了解決數學問題的效率。

          在開發過程中,研究團隊要求模型輸出自然語言描述和Python代碼形式的“思維鏈”步驟,并將自然語言作為Python代碼的注釋。他們僅使用Python代碼輸出進行訓練,這一做法旨在使模型更加清晰地展示其解題過程。

          為了進一步提升模型的性能,研究團隊還訓練了一個“策略模型”來生成數學推理步驟,并使用“過程偏好模型”(PPM)來選擇最有希望的解題步驟。這兩個模型通過四輪“自我進化”相互改進,不斷優化其解題能力。

          在訓練過程中,研究團隊使用了74萬道公開的數學應用題及其解答作為初始數據,并利用上述兩個模型生成了新的解題步驟。這一做法不僅豐富了訓練數據,還有助于模型更好地理解和解決數學問題。

          測試結果顯示,應用rStar-Math技術后,Qwen2.5-Math-7B模型的準確率從58.8%躍升至90.0%,Phi3-mini-3.8B模型的準確率也從41.4%提升到86.4%。與OpenAI的o1-preview模型相比,rStar-Math技術在兩個模型上的表現分別高出4.5%和0.9%。

          為了讓其他研究者能夠使用和改進rStar-Math技術,研究團隊已在Hugging Face上宣布,他們計劃將rStar-Math的代碼和數據在GitHub上公開。這一舉措將促進數學與人工智能領域的交流與合作,推動相關技術的進一步發展。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          成人免费无码精品国产电影| 久久精品久久精品| 中文字幕av日韩精品一区二区| 精品成人A区在线观看| 日本人精品video黑人| 国产伦精品一区二区三区免.费 | 在线视频精品免费| 伊人久久无码精品中文字幕| 国产成人精品久久二区二区| 国产美女精品视频| 日韩高清国产一区在线| 精品久久精品久久| 麻豆国产在线精品国偷产拍| 奇米精品一区二区三区在| 欲帝精品福利视频导航| 91精品国产自产在线观看| 亚洲精品人成无码中文毛片| 四虎国产精品免费视| 在线精品免费视频| 久久这里都是精品| 精品综合久久久久久98| 人妻少妇乱子伦精品| 久久福利青草精品资源站| 老司机精品视频在线| 国产在线精品美女观看| 精品人妻无码一区二区色欲产成人| 日本亚洲精品色婷婷在线影院| 99久久99久久精品免费观看| 久久精品国产一区二区三| 国内少妇偷人精品视频免费| 午夜精品久久久久久久99| 国内揄拍国内精品视频| 亚洲av永久中文无码精品| 无码国产精品一区二区免费式直播| 亚洲欧洲精品久久| 3d动漫精品啪啪一区二区中 | 精品一区二区久久久久久久网精| 久久精品国产亚洲AV| 国产精品夜夜春夜夜爽久久小| 99视频有精品视频免费观看| 麻豆精品不卡国产免费看|