OpenAI近期通過電子郵件向TechCrunch透露,其o3-mini模型迎來了一項重大更新——引入了全新的思維鏈技術。這一技術革新旨在提升用戶對模型推理過程的理解,使用戶對模型的響應更加清晰自信。
據OpenAI介紹,o3-mini等推理模型在輸出結果前會進行自我事實核查,這一特性雖然有助于避免模型陷入常見陷阱,但也導致了推理過程耗時較長,通常需要額外幾秒到幾分鐘。
與o3-mini類似的,DeepSeek的R1模型同樣作為一種推理模型,能夠展示完整的思維過程,這一做法備受人工智能研究人員的青睞。他們認為,推理步驟的展示不僅有助于模型研究,還能在某些情況下提升用戶體驗,幫助用戶判斷模型是否正在正確路徑上運行。
然而,OpenAI在過去并未展示o3-mini及其前身o1和o1-mini的完整推理步驟,這在一定程度上是出于競爭考慮。用戶往往只能看到推理步驟的摘要,而這些摘要有時并不準確。
盡管如此,OpenAI表示已找到了一種平衡之道。他們為o3-mini引入了更詳細的摘要功能,使模型能夠自由思考并有序地組織其想法。OpenAI發言人表示,為了提升清晰度和安全性,他們增加了一個后處理步驟,讓模型審查并刪除原始思路中的不安全內容,同時簡化復雜想法。這一后處理步驟還能使非英語用戶以母語接收思路,從而提升用戶體驗。
在上周的Reddit AMA活動中,OpenAI首席產品官Kevin Weil也暗示了這一變化即將到來。他表示,OpenAI正在努力展示更多內容,展示模型思維過程的功能很快就會出現。同時,他也承認展示所有思維鏈可能會引發競爭性的提煉,但他們知道用戶(尤其是高級用戶)對此有需求,因此將努力找到平衡之道。
此次更新標志著OpenAI在提升模型透明度和用戶體驗方面邁出了重要一步。隨著技術的不斷進步,未來我們或許能夠更深入地了解AI模型的思維方式,從而更好地利用這些技術服務于人類社會。