階躍星辰公司近期在AI領(lǐng)域邁出了重要一步,推出了Step-2系列語(yǔ)言模型的兩款全新產(chǎn)品。這兩款新品分別是Step-2 mini和Step文學(xué)大師版,它們各自擁有獨(dú)特的定位和優(yōu)勢(shì)。
Step-2 mini作為一款輕量級(jí)語(yǔ)言模型,以極小的參數(shù)量實(shí)現(xiàn)了高效能。與階躍星辰的萬(wàn)億參數(shù)大模型Step-2相比,Step-2 mini僅以約3%的參數(shù)量,就保留了其80%以上的卓越性能。這一突破性的設(shè)計(jì)使得Step-2 mini在保持高性能的同時(shí),擁有了更快的生成速度和極高的性價(jià)比。據(jù)悉,在輸入4000個(gè)token的情況下,Step-2 mini的平均首字時(shí)延僅為0.17秒,這一速度令人矚目。目前,用戶已經(jīng)可以在階躍星辰開(kāi)放平臺(tái)上輕松調(diào)用Step-2 mini的API接口,享受其帶來(lái)的便捷與高效。價(jià)格方面,Step-2 mini的輸入費(fèi)用為每百萬(wàn)token 1元,輸出費(fèi)用為每百萬(wàn)token 2元,這一價(jià)格策略無(wú)疑將吸引大量用戶。
Step-2 mini之所以能夠?qū)崿F(xiàn)如此高效的性能,得益于階躍星辰自主研發(fā)的新型注意力機(jī)制架構(gòu)——MFA(Multi-matrix Factorization Attention,多矩陣分解注意力)及其變體MFA-Key-Reuse。這一創(chuàng)新架構(gòu)相較于傳統(tǒng)的MHA(Multi-Head Attention,多頭注意力)架構(gòu),大幅節(jié)省了近94%的KV緩存開(kāi)銷,從而實(shí)現(xiàn)了更快的推理速度和更低的推理成本。
除了Step-2 mini之外,階躍星辰還推出了專為文字內(nèi)容創(chuàng)作研發(fā)的Step-2文學(xué)大師版。這款模型沿襲了Step-2的知識(shí)儲(chǔ)備和對(duì)文字細(xì)節(jié)的精準(zhǔn)把控能力,但更側(cè)重于強(qiáng)大的內(nèi)容創(chuàng)作能力。據(jù)官方介紹,Step-2文學(xué)大師版旨在解決當(dāng)前市面上語(yǔ)言模型普遍存在的“假大空”問(wèn)題,即內(nèi)容過(guò)度對(duì)齊、缺乏新意和真情實(shí)感。通過(guò)Step-2文學(xué)大師版,用戶可以期待獲得更加生動(dòng)、真實(shí)且具有創(chuàng)意的文字內(nèi)容。
階躍星辰此次推出的兩款新品,不僅展示了其在AI語(yǔ)言模型領(lǐng)域的深厚實(shí)力,也為廣大用戶提供了更加多樣化、高效化的選擇。未來(lái),隨著AI技術(shù)的不斷發(fā)展,階躍星辰有望繼續(xù)在AI領(lǐng)域引領(lǐng)創(chuàng)新潮流,為用戶帶來(lái)更多驚喜。