對(duì)于AI領(lǐng)域的領(lǐng)頭羊OpenAI,你在期待什么?GPT-5還是文生視頻模型Sora?或者是ChatGPT實(shí)時(shí)語(yǔ)音功能!
對(duì)于ChatGPT實(shí)時(shí)語(yǔ)音功能,我們等了太久。而今天,它終于要來(lái)了!
就在剛剛,OpenAI通過(guò)社交媒體官宣,實(shí)時(shí)語(yǔ)音功能(OpenAI官方命名為:Advanced Voice Mode)將在本周內(nèi)向所有ChatGPT Plus和Team會(huì)員用戶推送。同時(shí),OpenAI還為實(shí)時(shí)語(yǔ)音功能添加了自定義指令(Custom Instructions)、記憶(Memory)、五種新聲音(five new voices),以及改進(jìn)的口音(improved accents)。
如何判斷有沒(méi)有被推送到實(shí)時(shí)語(yǔ)音
如何知道自己已經(jīng)被推送到實(shí)時(shí)語(yǔ)音功能了?很簡(jiǎn)單,在手機(jī)上打開(kāi)ChatGPT app,點(diǎn)擊頁(yè)面右下角(輸入框右側(cè))的語(yǔ)音按鈕,如果你的賬號(hào)已經(jīng)被推送了實(shí)時(shí)語(yǔ)音,那么會(huì)看到下面這個(gè)截圖中的確認(rèn)信息。
點(diǎn)擊Continue,ChatGPT會(huì)指導(dǎo)你開(kāi)始選擇你喜歡的聲音音色,此時(shí)已經(jīng)可以看到新增加的五個(gè)聲音了,標(biāo)記為NEW的就是新聲音。點(diǎn)擊每種聲音,可以進(jìn)行試聽(tīng),選擇你喜歡的聲音即可。
點(diǎn)擊Done,就可以開(kāi)始和ChatGPT愉快的語(yǔ)音聊天了!
如果還沒(méi)有被推送到這個(gè)新功能,則會(huì)在常規(guī)的語(yǔ)音聊天頁(yè)面看到下面這個(gè)提示。
Advanced voice mode is on its way
Advanced voice mode is starting to roll out to all users. You don't have access yet, but check back soon to start using the new features.
ChatGPT的9種聲音
算上新增加的五種新聲音,目前ChatGPT內(nèi)共有9種聲音可以選擇。
Sol(NEW)– 聰慧且放松 (Savvy and relaxed)
這是一種聰明而悠閑的聲音,適合想要一種輕松愉快對(duì)話體驗(yàn)的用戶。
Ember – 自信且樂(lè)觀 (Confident and optimistic)
這是一種充滿信心和積極向上的聲音,適合傳達(dá)堅(jiān)定與熱情。
Maple(NEW)– 活潑且坦率 (Cheerful and candid)
這是一種充滿活力和真誠(chéng)的聲音,適合輕松、開(kāi)朗的對(duì)話。
Arbor(NEW)– 隨和且多才多藝 (Easygoing and versatile)
這是一種隨和且適應(yīng)性強(qiáng)的聲音,適合多種對(duì)話場(chǎng)景,給人輕松自然的感覺(jué)。
Juniper – 開(kāi)朗且積極 (Open and upbeat)
這是一種充滿開(kāi)放和積極向上情緒的聲音,適合愉快的交流場(chǎng)景。
Vale(NEW)– 明亮且好奇 (Bright and inquisitive)
這是一種充滿好奇心和求知欲的聲音,給人一種明快而機(jī)智的感覺(jué)。
Spruce(NEW)– 平靜且充滿肯定 (Calm and affirming)
這是一種沉穩(wěn)并富有肯定性的聲音,適合營(yíng)造安心的對(duì)話氛圍。
Breeze – 生動(dòng)且真誠(chéng) (Animated and earnest)
這是一種充滿生氣和誠(chéng)懇的聲音,適合表達(dá)熱情與真誠(chéng)。
Cove – 沉著且直接 (Composed and direct)
這是一種冷靜且直接的聲音,適合簡(jiǎn)潔明了的對(duì)話風(fēng)格。
并且,OpenAI表示提高了部分外語(yǔ)的對(duì)話速度、流暢度和口音。雖然OpenAI并沒(méi)有明確指出針對(duì)哪些外語(yǔ)(此處的外語(yǔ)指的是英語(yǔ)以外的語(yǔ)言)做了優(yōu)化,但經(jīng)過(guò)我的測(cè)試,在實(shí)時(shí)語(yǔ)音模式下,用中文和ChatGPT對(duì)話,ChatGPT的中文回復(fù)比之前強(qiáng)了很多,聽(tīng)起來(lái)更加自然流暢,沒(méi)有之前那么生硬。
為什么推薦實(shí)時(shí)語(yǔ)音功能
很多AI工具都有語(yǔ)音對(duì)話的功能,為什么ChatGPT的這個(gè)實(shí)時(shí)語(yǔ)音功能令人期待?
如果你使用過(guò)之前的ChatGPT或者Kimi的語(yǔ)音對(duì)話功能,你應(yīng)該能感覺(jué)到這些傳統(tǒng)的語(yǔ)音對(duì)話還是沒(méi)有跳出“一問(wèn)一答模式”,你對(duì)它說(shuō)一句話,它首先會(huì)調(diào)用LLM模型生成輸出文字,然后用文字轉(zhuǎn)語(yǔ)音模型將這些輸出文字以語(yǔ)音的形式“念”出來(lái),在它念完之前,你無(wú)法再和它進(jìn)行任何對(duì)話,不能中途打斷。
這樣的對(duì)話并不是真正的“對(duì)話”。
相比之下,ChatGPT的實(shí)時(shí)語(yǔ)音則更加自然、流暢,體驗(yàn)已經(jīng)無(wú)限逼近了現(xiàn)實(shí)生活中的實(shí)時(shí)對(duì)話。這一新功能讓用戶可以在與ChatGPT的對(duì)話過(guò)程中隨時(shí)插話、打斷,就像與真人進(jìn)行電話交流一樣,不再受限于AI一問(wèn)一答的模式。并且,過(guò)去AI生成語(yǔ)音回答需要等待數(shù)秒,如今這種延遲已被消除,ChatGPT能夠即刻理解并給出回應(yīng),使整個(gè)對(duì)話過(guò)程更加連貫。
此外,情感感知能力也是實(shí)時(shí)語(yǔ)音功能的亮點(diǎn)之一。ChatGPT不僅能理解用戶的語(yǔ)音內(nèi)容,還能夠識(shí)別出情緒變化,比如用戶在講話時(shí)喘息,它會(huì)建議你“慢下來(lái)”。這種智能情感反饋?zhàn)尰?dòng)變得更貼近人類(lèi)溝通方式,使對(duì)話更加真實(shí)自然。
如何才能使用實(shí)時(shí)語(yǔ)音功能
使用ChatGPT的實(shí)時(shí)語(yǔ)音功能需要滿足2個(gè)條件:
擁有一個(gè)ChatGPT賬號(hào)。如何注冊(cè)可以參考我這篇文章:《『AI保姆級(jí)教程』無(wú)需手機(jī)號(hào)!三分鐘注冊(cè)ChatGPT賬號(hào)!2024年最新教程!》。
需要開(kāi)通ChatGPT Plus或Team會(huì)員,因?yàn)槟壳?strong>實(shí)時(shí)語(yǔ)音功能僅對(duì)ChatGPT Plus和Team付費(fèi)會(huì)員開(kāi)放。個(gè)人用戶建議開(kāi)通ChatGPT Plus會(huì)員即可,高級(jí)模型(GPT-4o、o1)的使用次數(shù)足夠個(gè)人使用了。如何開(kāi)通可以參考我這篇文章:《國(guó)內(nèi)支付寶開(kāi)通ChatGPT Plus和Claude Pro 2024最新教程!》。
注意,ChatGPT的實(shí)時(shí)語(yǔ)音功能僅支持移動(dòng)端(手機(jī)app)和Mac客戶端,網(wǎng)頁(yè)端是不支持語(yǔ)音功能的。
結(jié)語(yǔ)
之前一直等待ChatGPT實(shí)時(shí)語(yǔ)音功能的小伙伴可以行動(dòng)起來(lái)了!
- Apple Intelligence將于10月28日發(fā)布,ChatGPT集成推遲!
- DeepSeek vs ChatGPT:人工智能的兩大巨頭對(duì)比,哪個(gè)更適合你?
- 關(guān)于ChatGPT實(shí)時(shí)語(yǔ)音功能,你需要知道的15點(diǎn)總結(jié)!
- ChatGPT高級(jí)語(yǔ)音模式正在向Web網(wǎng)頁(yè)端推出!
- 2024最輕松、最簡(jiǎn)單的升級(jí)ChatGPT Plus 的方式:wildcard虛擬信用卡
- ChatGPT Windows客戶端已全面開(kāi)放!附詳細(xì)教程!
- 2024年ChatGPT手機(jī)號(hào)驗(yàn)證碼接碼平臺(tái)SMS-Activate使用方法
- DeepSeek為啥吹的這么過(guò)分?與ChatGPT的實(shí)測(cè)對(duì)比
- 無(wú)需手機(jī)號(hào)!三分鐘注冊(cè)ChatGPT賬號(hào)!2024年AI保姆級(jí)教程
- 華山論劍:文心一言、智譜清言、訊飛星火、通義千問(wèn)、新華妙筆、 ChatGPT,公文寫(xiě)作哪家強(qiáng)?
本文鏈接:http://www.tondou.cn/post/1755.html ,轉(zhuǎn)載需注明文章鏈接來(lái)源:http://www.tondou.cn/
- 喜歡(10)
- 不喜歡(1)