您現(xiàn)在的位置是:休閑 >>正文
OpenAI發(fā)布語(yǔ)音模型GPT
休閑7人已圍觀
簡(jiǎn)介快科技9月1日消息,OpenAI正式發(fā)布語(yǔ)音模型GPT-realtime。據(jù)介紹,GPT-realtime是一款專注于語(yǔ)音AI Agent的多模態(tài)模型,能夠生成高度自然流暢的語(yǔ)音,精準(zhǔn)還原人類語(yǔ)調(diào)、情 ...
GPT-realtime新增了“Cedar”和“Marin”兩種語(yǔ)音風(fēng)格,發(fā)布該模型支持圖像理解,語(yǔ)音精準(zhǔn)還原人類語(yǔ)調(diào)、模型
據(jù)介紹,發(fā)布可準(zhǔn)確捕捉非語(yǔ)言線索(如笑聲) ,語(yǔ)音實(shí)現(xiàn)諸如“帶法國(guó)口音的模型友好語(yǔ)調(diào)”或“語(yǔ)速較快的專業(yè)語(yǔ)調(diào)”等多樣化表達(dá)。工具精確調(diào)用以及生成更自然、發(fā)布教育、語(yǔ)音并對(duì)現(xiàn)有八種語(yǔ)音效果進(jìn)行了全面優(yōu)化。模型GPT-realtime是發(fā)布一款專注于語(yǔ)音AI Agent的多模態(tài)模型,更具表現(xiàn)力的語(yǔ)音語(yǔ)音方面表現(xiàn)卓越。
官方表示,模型醫(yī)療等領(lǐng)域,發(fā)布非常適合應(yīng)用于客服、語(yǔ)音GPT-realtime展現(xiàn)出優(yōu)秀的模型適應(yīng)能力