隨著人工智能技術的迅猛發展,每一次技術變革都預示著行業的躍遷式進步。面對以AI為核心的新一輪技術浪潮,企業如何在技術支撐上做好準備,迎接通用人工智能時代的到來,成為了亟待解決的問題。
近日,在2024火山引擎FORCE原動力大會冬季技術主論壇上,一系列創新產品及升級方案亮相,旨在解決企業在落地大模型過程中遇到的實際難題。字節跳動基礎架構負責人趙鵬偉在會上表示,為了迎接通用人工智能時代,企業需要在性價比、創新及安全等多個維度進行布局。火山引擎為此提供了AI云原生式的全鏈路產品服務能力,涵蓋豆包大模型、大模型服務、AI基礎設施、數據和安全等多個方向的新成果,致力于與企業和開發者共同推進AI的創新變革。
趙鵬偉進一步指出,過去十年中,云原生架構以其彈性、存算分離及服務化等能力,為企業構建大規模業務系統提供了有力支持。然而,隨著AI時代的到來,計算模式逐漸轉向以GPU為核心,傳統架構難以充分發揮GPU的高算力及高帶寬優勢。同時,GPU在訓練和推理場景中對高速互聯、在線存儲及隱私安全提出了更高要求。因此,火山引擎提出,下一個十年的計算范式應進入AI云原生的新時代,以GPU為核心重新優化計算、存儲與網絡架構,實現GPU直接訪問存儲和數據庫,顯著降低IO延遲,并提供更高規模的高速互聯及端到端的安全保護。
在計算層面,火山引擎推出了新一代GPU實例,通過vRDMA網絡支持大規模并行計算和P/D分離推理架構,顯著提升了訓練和推理效率,降低了成本。在存儲方面,新推出的EIC彈性極速緩存能夠實現GPU直連,使大模型推理時延降低至原來的五十分之一,成本降低20%。在安全層面,火山引擎將推出PCC私密云服務,構建大模型的可信應用體系,實現用戶數據在云上推理的端到端加密,且性能優越,推理時延與明文模式相比差異在5%以內。
作為一站式大模型服務平臺,火山方舟通過Cache、離線推理模式等產品升級,以及全新發布的Prompt優解,加速了大模型能力的落地。Prompt優解通過“自動+互動”的方式協助用戶編寫提示詞,使用戶在互動中表達需求,快速上手。利用機器實現類似人類的反思、類比及錯誤總結能力,全自動優化prompt,助力企業以低成本高效率獲得高質量prompt。目前,Prompt優解已通過火山方舟全面開放公測。
火山引擎始終堅持提供更低成本、更高質量的服務。為踐行“人人用得起,才是好模型”的理念,火山引擎發布了離線批量推理方案和上下文緩存,幫助用戶實現更為精細化和低成本的運營。全新發布的扣子1.5和HiAgent1.5,助力企業打造AI原生應用,跨越從通用大模型到企業AI應用落地的三道鴻溝。
豆包大模型也發布了多個新版本,包括豆包·視覺理解模型、豆包·文生圖模型2.1和豆包·音樂模型,這些模型可以通過扣子以插件的方式體驗,有助于更多多模態AI應用的誕生。在數據智能方面,火山引擎發布了數據飛輪2.0,通過AI創新重新定義企業數據智能,全面注入大模型,帶來前所未有的決策洞察。通過一體化數智研發與一站式數據智能運營,簡化工作流程,快速處理結構與非結構數據資產,激發企業更多潛在數據資產,實現更大動力。
數據飛輪2.0圍繞企業數據建設與數據應用的各個環節,全系產品迎來了全面實現AI創新的新階段。同時,火山引擎發布了兩大核心方案:一是Data Fabric驅動下的ChatBI智能體,使數據消費更加簡單直接,通過構建完整的智能數據服務體系,打破數據“專業”壁壘,幫助企業內每個業務定制專屬智能體,降低數據使用門檻,提升大模型能力下的數據反饋效率和準確率;二是多模態數據湖,拓寬數據資產的邊界,實現海量結構化、半結構化及非結構化數據的統一精細化管理,全方位兼容各類數據格式,為LLM預訓練、持續訓練和微調提供全程支持。
在云安全方面,火山引擎圍繞“讓智能更安全、讓安全更智能”的理念,為AI基礎設施提供透明可信的安全保障。同時,通過安全智能體,將字節跳動積累的安全經驗服務于每個企業,為AI應用提供堅實的安全后盾。
隨著大模型應用進入快速發展階段,企業對模型能力、價格及落地難度提出了更高要求。火山引擎本次發布的多款全新產品及升級方案,進一步降低了模型訓練及推理應用的難度,以高性價比和強安全保障,為企業落地AI能力奠定了堅實基礎。