近期,互聯網巨頭字節跳動旗下的AI助手豆包,悄然展開了一項新功能的內部測試,這一消息迅速引起了網友們的廣泛關注。據透露,豆包正在探索深度思考模型的應用,盡管此次測試并未采用此前熱議的DeepSeek模型。
3月5日,豆包官方正式宣布推出“深度思考”推理模式,這一模式將全面融入問答、搜索、寫作及閱讀等多個應用場景。用戶只需簡單地在輸入框中啟用“深度思考 Beta”功能,即可體驗這一創新功能。
針對此次測試,豆包方面回應稱,當前正在進行的是自家深度思考模型的多個實驗版本的內部評估。有知情人士透露,豆包深度思考模型的研發是基于其1.5基座模型的進一步升級與優化。
回溯至今年1月中旬,豆包大模型團隊在發布豆包1.5 Pro版本時,就已預告了深度推理模型Doubao-1.5-pro-AS1-Preview的存在。該團隊強調,這一模型在不依賴其他外部模型數據的前提下,通過強化學習(RL)算法的突破與工程優化,充分利用了測試時縮放(Test Time Scaling)的算力優勢,成功實現了RL Scaling,從而研發出了豆包的深度思考模式。
深度思考模式的推出,意味著用戶將能夠直觀地觀察到AI模型的思考過程。這一過程涉及思維鏈(Chain of Thought,簡稱COT)的展示,即模型通過訓練模擬出類似人類的思考步驟,包括自我質疑、反思等中間環節,盡管這些僅是文字序列,但卻呈現出類似人類的思考邏輯。
在深度思考模式下,用戶不僅能夠獲取AI的最終答案,還能清晰地看到模型解決問題的完整邏輯鏈條。例如,在解答數學題目時,模型會逐步展示從問題拆解、多種方法驗證到得出最終結論的全過程,包括自我質疑、假設驗證及錯誤修正等關鍵步驟,為用戶提供了前所未有的透明度和深度理解。