智譜公司今日揭曉了其最新研發(fā)成果——GLM-4-Voice,一款端到端情感語音模型。該模型不僅具備情感理解與表達(dá)能力,還能實現(xiàn)情感共鳴,為用戶帶來更為真實的交互體驗。用戶現(xiàn)在即可通過“智譜清言”App,親身體驗這一創(chuàng)新技術(shù)。
GLM-4-Voice的亮點在于其豐富的情感表達(dá)和細(xì)膩的變化,能夠準(zhǔn)確傳達(dá)高興、悲傷、生氣、害怕等多種情緒。同時,它還支持語速調(diào)節(jié),用戶可根據(jù)需要隨時要求加快或放慢語速。該模型還具備隨時打斷和靈活輸入指令的功能,使得對話互動更加自然流暢。
在語言支持方面,GLM-4-Voice表現(xiàn)出色,不僅支持中英文語音,還能識別中國各地方言,如粵語、重慶話、北京話等。該模型還即將上線視頻通話功能,實現(xiàn)邊看邊說的全新交互體驗。
智譜的另一大亮點AutoGLM也備受矚目,它具備phone use能力,能夠模擬人類操作手機,無需用戶手動搭建復(fù)雜工作流,操作邏輯與人類相似。
GLM-4-Voice已同期對外開源,成為智譜首個開源的端到端多模態(tài)模型。感興趣的用戶可訪問以下代碼倉庫了解更多詳情:
https://github.com/THUDM/GLM-4-Voice
GLM-4-Voice的開源將有助于推動相關(guān)領(lǐng)域的進(jìn)一步研究與發(fā)展,為行業(yè)注入新的活力。