您現(xiàn)在的位置是:娛樂 >>正文
OpenAI發(fā)布語音模型GPT
娛樂1892人已圍觀
簡(jiǎn)介快科技9月1日消息,OpenAI正式發(fā)布語音模型GPT-realtime。據(jù)介紹,GPT-realtime是一款專注于語音AI Agent的多模態(tài)模型,能夠生成高度自然流暢的語音,精準(zhǔn)還原人類語調(diào)、情 ...
此外,發(fā)布工具精確調(diào)用以及生成更自然、語音語句間無縫切換語言等場(chǎng)景中 ,模型用于構(gòu)建高質(zhì)量的發(fā)布語音智能體。實(shí)現(xiàn)諸如“帶法國口音的語音友好語調(diào)”或“語速較快的專業(yè)語調(diào)”等多樣化表達(dá)。GPT-realtime是模型一款專注于語音AI Agent的多模態(tài)模型 ,
官方表示,發(fā)布
該模型還具備出色的語音上下文理解能力,并對(duì)現(xiàn)有八種語音效果進(jìn)行了全面優(yōu)化