就在幾小時前,OpenAI官方賬號在社交媒體平臺X上發布了一條“晦澀難懂”的帖子。
Another Advanced Voice update for you—it’s rolling out now on http://ChatGPT.com on desktop for all paid users.
So you can easily learn how to say the things you're doing an entire presentation on.
你能看懂OpenAI在說什么嗎?其實不止是我們,連母語是英文的外國網友們也紛紛表示看不懂這條更新描述,表示“讀得腦仁疼”。
經過多方查證,OpenAI這條更新指的是高級語音模式(Advanced Voice Mode),也就是平時說的實時語音,正在向ChatGPT網頁端推出!也就是,以后可以在瀏覽器上和ChatGPT語音對話了!
來自網友的確認。
ChatGPT上的語音模式分為兩種:標準語音模式(Standard voice)和高級語音模式(Advanced Voice Mode)。
其中,標準語音模式是通過傳統的文本轉語音模型(TTS,Text To Speech) 實現的,也就是如果你對ChatGPT說一句話,會經過語音轉文本、文本處理(生成答案)、文本轉語音這三個過程,技術層面看用到的模型分別是Whisper語音轉文本模型、GPT-4、Text To Speech文本轉語音模型。
這樣的語音模式造成的效果就是延遲感很重,每一個問題ChatGPT都需要思考一段時間然后再說話,并且一旦ChatGPT開始說話,就無法停止,你必須耐著性子聽完整個回答。這是由上面提到的實現方式決定的。
而高級語音模式則完全不同。高級語音模式基于GPT-4o模型的多模態能力,采用了端到端的語音處理方式,直接通過GPT-4o模型進行語音理解和生成一條龍服務。正因為此,這種語音模式下的對話更加自然流暢,基本感受不到延遲,同時端到端意味著可以隨時打斷ChatGPT的回復,就像是人和人之間真正的對話一樣。高級語音模式的另外一個重要特點是能夠理解語音語調、速度和情感變化,提供無限逼近自然對話的語音交互體驗。
這也是為什么高級語音模式(Advanced Voice Mode)一經推出就備受好評的原因。而市面上其他大多數支持語音對話的AI工具還都停留在傳統的文本轉語音階段。
由于受到系統、技術框架的限制,語音模式一直以來都是手機app的專屬功能。就在最近,才在桌面客戶端,包括Mac和Win兩個版本,也上線了高級語音模式。
而本周起,我們將能夠直接在ChatGPT網頁端(即瀏覽器)使用高級語音功能,和ChatGPT對話。這對于沒有或不想用桌面客戶端的小伙伴還是非常友好的。
和之前的一些高級功能一樣,網頁端的高級語音功能也是優先向付費用戶開放,包括Plus/Enterprise/Team/Edu計劃的訂閱用戶。其中受眾最廣的Plus會員,費用為20美元每月。
關于高級語音模式更加詳細的解釋和介紹,可以看以下系列文章。
關于ChatGPT實時語音功能,你需要知道的15點總結!
重磅!ChatGPT實時語音終于要來了!附詳細使用說明
結語
附上OpenAI首席產品官(CPO)Kevin Weil針對這個更新的詳細介紹。
- Apple Intelligence將于10月28日發布,ChatGPT集成推遲!
- DeepSeek vs ChatGPT:人工智能的兩大巨頭對比,哪個更適合你?
- 關于ChatGPT實時語音功能,你需要知道的15點總結!
- 2024最輕松、最簡單的升級ChatGPT Plus 的方式:wildcard虛擬信用卡
- ChatGPT Windows客戶端已全面開放!附詳細教程!
- 2024年ChatGPT手機號驗證碼接碼平臺SMS-Activate使用方法
- 無需手機號!三分鐘注冊ChatGPT賬號!2024年AI保姆級教程
- DeepSeek為啥吹的這么過分?與ChatGPT的實測對比
- 華山論劍:文心一言、智譜清言、訊飛星火、通義千問、新華妙筆、 ChatGPT,公文寫作哪家強?
- 如何在ios系統上注冊使用ChatGPT(2024年最新版)
本文鏈接:http://www.tondou.cn/post/1798.html ,轉載需注明文章鏈接來源:http://www.tondou.cn/
- 喜歡(11)
- 不喜歡(3)