前兩天奧特曼放出消息說OpenAI將連續12天直播大放送,我還特意發了篇文章,充滿期待!
我知道好多AI圈子里的人別說GPT5、sora了,AGI我們都準備好迎接了,但是直播是啥情況呢?
15分鐘極速直播就一個o1滿血版,還在這炫耀!!!
看到很多人都在狂噴這次發布會,號稱史上最寒酸的發布會,有一位網友,對于產品的定價,也算是說出了大家的心聲~
不過,作為人工智能領域的科技巨頭,OpenAI還是有點東西的,這兩天講了點啥呢?
|o1 模型:性能的實質性提升
相較于之前的預覽版本,o1 模型在多個關鍵維度上實現了明顯進步:
1.智能能力的提升OpenAI 通過數學競賽題、編程挑戰和科學難題的測試,展示了 o1 模型在基礎智能能力上的顯著進步。
測試數據顯示,模型出現重大錯誤的概率較預覽版**降低了約34%**,這意味著在日常使用場景中,模型的可靠性和準確性都得到了實質性提升。
2.響應速度的優化
針對此前用戶反饋"慢思考"的詬病,o1 模型在響應機制上做出了重大調整。通過智能判斷問題復雜程度,模型能夠對簡單問題給出快速響應,同時在面對復雜問題時仍保持深入思考的能力。OpenAI 內部研究表明,模型整體思考速度較預覽版提高了約50%。
3.多模態能力的擴展
圖像識別是 o1 模型的一個重要突破。在發布會現場演示中,研究人員上傳了一張手繪的熱力學草圖,模型成功識別并進行多模態推理。
雖然看起來這么厲害,但天底下哪有免費的午餐,說話間就帶出了一個比Plus訂閱貴十倍的新訂閱計劃……
奧特曼,你當我們是韭菜嗎?
不過也能看出來,看來OpenAI也是真缺錢了~
他們也說了,200美元的月度訂閱價格并非面向普通消費者,而是專門針對對人工智能有剛性需求的高階用戶和專業團隊。
Pro 版本的核心價值
無限制使用高級模型
全天候高級語音模式
模型結果可靠性的微小提升
優先體驗最新技術特性
不過勵志做科研的人員,值得嘗試一下~
|強化微調
第二天,奧特曼直接不來了,讓團隊繼續上演15分鐘小課堂,講了o1mini的強化微調。
這個具體有什么用呢?
一句話說,就是以后大家可以用自己的數據集把o1從高中水平升級到你所在領域的博士專家級水平。
現場也是有一位遺傳病專家演示了經過微調之后的omini模型,得分上升了80%,甚至比滿血版的o1還要強。那這個強化微調到底是什么呢?
首先聽名字肯定用的是強化學習方法,但是跟原來的微調有什么區別呢?
想象一下,我們有兩種方式來教一個人如何烹飪。
傳統微調的方式就像是這樣:你給一個新手廚師看很多食譜和成品照片,讓他們仔細觀察這些成功的菜肴是什么樣子的,但并不讓他們親自下廚。
你只是讓他們看,希望他們能從這些食譜和成品照片中自己領悟出烹飪的技巧。
強化微調的方式則不同:你給新手廚師一些基本的食材和烹飪工具,讓他們自己嘗試做菜。每次他們做完一道菜后,你嘗一嘗,然后告訴他們這道菜做得怎么樣,比如這道菜的味道不錯,但是火候掌握得不夠好。
廚師就會根據你的反饋來調整自己的烹飪方法,強化做得好的地方,改進做得不好的地方。這樣,他們可能只需要做幾次菜就能掌握烹飪技巧,而且學得更快、更好。
但是,強化微調并不是對所有事情都有效。比如學習園藝,可能多觀察植物的生長、多澆水施肥會更有幫助。
而在需要邏輯推理和系統思考的任務上,比如設計一座花園,你可能需要自己先規劃,然后讓有經驗的園丁來給你提建議。
所以,強化微調更適合那些需要專業知識和系統性思考的領域,比如法律、醫療、建筑設計、園藝規劃、烹飪藝術等。
對于簡單的模仿和重復性工作,比如模仿某個人的簽名或者簡單的流水線作業,可能就不是那么適用。
現在它還只面向一些高校、企業和開發者開放測試。
兩天的發布會不僅僅是一次技術更新,更是 OpenAI 在人工智能商業化道路上的又一次嘗試。200美元的 Pro 版本,實際上是在測試市場:到底有多少用戶愿意為"世界上最聰明"的大模型付費?
而強化微調,似乎又在通往AGI的道路上前進了一小步~
好了,暫時就說這么多,另外,Altman又放出了一個新的信號……
本文鏈接:http://www.tondou.cn/post/1806.html ,轉載需注明文章鏈接來源:http://www.tondou.cn/
- 喜歡(10)
- 不喜歡(2)