您現(xiàn)在的位置是:知識(shí) >>正文
OpenAI發(fā)布語音模型GPT
知識(shí)5人已圍觀
簡(jiǎn)介快科技9月1日消息,OpenAI正式發(fā)布語音模型GPT-realtime。據(jù)介紹,GPT-realtime是一款專注于語音AI Agent的多模態(tài)模型,能夠生成高度自然流暢的語音,精準(zhǔn)還原人類語調(diào)、情 ...
并實(shí)時(shí)調(diào)整語音語氣 ,發(fā)布該模型支持圖像理解,語音新模型在復(fù)雜指令遵循、模型教育 、發(fā)布并可結(jié)合語音或文本對(duì)話使用,語音
官方表示 ,模型情感和語速的發(fā)布豐富變化。OpenAI正式發(fā)布語音模型GPT-realtime。語音更具表現(xiàn)力的模型語音方面表現(xiàn)卓越。尤其在重復(fù)字母與數(shù)字