字節跳動旗下的豆包大模型近期宣布了在技術領域的顯著進步,特別是在通用語言、視頻生成、語音對話及視覺理解等方面,已經成功躋身國際前沿梯隊。這一成就,是在豆包大模型自今年5月15日首次亮相后的短短七個月內取得的。
據悉,截至2024年底,豆包大模型推出了最新版本Doubao-pro-1215,該版本在綜合能力上相較于5月時提升了32%,并已全面與GPT-4o對齊。尤其在處理數學問題和專業知識等復雜場景時,Doubao-pro-1215的表現甚至優于GPT-4o。更為引人注目的是,Doubao-pro-1215的推理服務價格僅為GPT-4o的八分之一,這無疑為其在市場上的競爭力增添了重要砝碼。
豆包大模型在技術上的突破,得益于其在模型稀疏度提升、強化學習引入等方面的海量數據優化及模型架構創新。這些努力使得Doubao-pro-1215在理解精度和生成質量上實現了大幅提升,為用戶帶來了更加準確和流暢的體驗。
豆包大模型還首次展示了其300萬字窗口的長文本處理能力。這一能力使得豆包能夠一次性輕松閱讀上百篇學術報告,且每百萬tokens的處理延遲僅為15秒。這一成就的背后,是STRING等上下文關聯數據算法的應用,以及稀疏化及分布式方案的實施,它們共同提升了LLM利用海量外部知識的能力,并將時延降至了十秒級。