石南AI工具導航
登錄
網站目錄

Open AI的o1滿血版翻身當爸爸,“強化微調”直接PK頂尖專家,奧特曼還是會玩!

石南12432024-12-07 16:55:21

前兩天奧特曼放出消息說OpenAI將連續12天直播大放送,我還特意發了篇文章,充滿期待!

我知道好多AI圈子里的人別說GPT5、sora了,AGI我們都準備好迎接了,但是直播是啥情況呢?

Open AI的o1滿血版翻身當爸爸,“強化微調”直接PK頂尖專家,奧特曼還是會玩! 第1張

15分鐘極速直播就一個o1滿血版,還在這炫耀!!!


Open AI的o1滿血版翻身當爸爸,“強化微調”直接PK頂尖專家,奧特曼還是會玩! 第2張

看到很多人都在狂噴這次發布會,號稱史上最寒酸的發布會,有一位網友,對于產品的定價,也算是說出了大家的心聲~

Open AI的o1滿血版翻身當爸爸,“強化微調”直接PK頂尖專家,奧特曼還是會玩! 第3張

不過,作為人工智能領域的科技巨頭,OpenAI還是有點東西的,這兩天講了點啥呢?

|o1 模型:性能的實質性提升

相較于之前的預覽版本,o1 模型在多個關鍵維度上實現了明顯進步:

1.智能能力的提升OpenAI 通過數學競賽題、編程挑戰和科學難題的測試,展示了 o1 模型在基礎智能能力上的顯著進步。

測試數據顯示,模型出現重大錯誤的概率較預覽版**降低了約34%**,這意味著在日常使用場景中,模型的可靠性和準確性都得到了實質性提升。

Open AI的o1滿血版翻身當爸爸,“強化微調”直接PK頂尖專家,奧特曼還是會玩! 第4張

2.響應速度的優化

針對此前用戶反饋"慢思考"的詬病,o1 模型在響應機制上做出了重大調整。通過智能判斷問題復雜程度,模型能夠對簡單問題給出快速響應,同時在面對復雜問題時仍保持深入思考的能力。OpenAI 內部研究表明,模型整體思考速度較預覽版提高了約50%。

Open AI的o1滿血版翻身當爸爸,“強化微調”直接PK頂尖專家,奧特曼還是會玩! 第5張

3.多模態能力的擴展

圖像識別是 o1 模型的一個重要突破。在發布會現場演示中,研究人員上傳了一張手繪的熱力學草圖,模型成功識別并進行多模態推理。

雖然看起來這么厲害,但天底下哪有免費的午餐,說話間就帶出了一個比Plus訂閱貴十倍的新訂閱計劃……

Open AI的o1滿血版翻身當爸爸,“強化微調”直接PK頂尖專家,奧特曼還是會玩! 第6張

奧特曼,你當我們是韭菜嗎?


不過也能看出來,看來OpenAI也是真缺錢了~

他們也說了,200美元的月度訂閱價格并非面向普通消費者,而是專門針對對人工智能有剛性需求的高階用戶和專業團隊。

Pro 版本的核心價值

無限制使用高級模型

全天候高級語音模式

模型結果可靠性的微小提升

優先體驗最新技術特性

不過勵志做科研的人員,值得嘗試一下~

|強化微調

第二天,奧特曼直接不來了,讓團隊繼續上演15分鐘小課堂,講了o1mini的強化微調

Open AI的o1滿血版翻身當爸爸,“強化微調”直接PK頂尖專家,奧特曼還是會玩! 第7張

這個具體有什么用呢?


一句話說,就是以后大家可以用自己的數據集把o1從高中水平升級到你所在領域的博士專家級水平。

現場也是有一位遺傳病專家演示了經過微調之后的omini模型,得分上升了80%,甚至比滿血版的o1還要強。那這個強化微調到底是什么呢?

Open AI的o1滿血版翻身當爸爸,“強化微調”直接PK頂尖專家,奧特曼還是會玩! 第8張

首先聽名字肯定用的是強化學習方法,但是跟原來的微調有什么區別呢?

想象一下,我們有兩種方式來教一個人如何烹飪。

Open AI的o1滿血版翻身當爸爸,“強化微調”直接PK頂尖專家,奧特曼還是會玩! 第9張

傳統微調的方式就像是這樣:你給一個新手廚師看很多食譜和成品照片,讓他們仔細觀察這些成功的菜肴是什么樣子的,但并不讓他們親自下廚。

你只是讓他們看,希望他們能從這些食譜和成品照片中自己領悟出烹飪的技巧。

強化微調的方式則不同:你給新手廚師一些基本的食材和烹飪工具,讓他們自己嘗試做菜。每次他們做完一道菜后,你嘗一嘗,然后告訴他們這道菜做得怎么樣,比如這道菜的味道不錯,但是火候掌握得不夠好。

廚師就會根據你的反饋來調整自己的烹飪方法,強化做得好的地方,改進做得不好的地方。這樣,他們可能只需要做幾次菜就能掌握烹飪技巧,而且學得更快、更好。

但是,強化微調并不是對所有事情都有效。比如學習園藝,可能多觀察植物的生長、多澆水施肥會更有幫助。

而在需要邏輯推理和系統思考的任務上,比如設計一座花園,你可能需要自己先規劃,然后讓有經驗的園丁來給你提建議。

所以,強化微調更適合那些需要專業知識和系統性思考的領域,比如法律、醫療、建筑設計、園藝規劃、烹飪藝術等。

對于簡單的模仿和重復性工作,比如模仿某個人的簽名或者簡單的流水線作業,可能就不是那么適用。

現在它還只面向一些高校、企業和開發者開放測試。

兩天的發布會不僅僅是一次技術更新,更是 OpenAI 在人工智能商業化道路上的又一次嘗試。200美元的 Pro 版本,實際上是在測試市場:到底有多少用戶愿意為"世界上最聰明"的大模型付費?

而強化微調,似乎又在通往AGI的道路上前進了一小步~

好了,暫時就說這么多,另外,Altman又放出了一個新的信號……

Open AI的o1滿血版翻身當爸爸,“強化微調”直接PK頂尖專家,奧特曼還是會玩! 第10張


本文鏈接:http://www.tondou.cn/post/1806.html ,轉載需注明文章鏈接來源:http://www.tondou.cn/

分享到:
標簽:Open AIChatGPT
  • 不喜歡(2
本文轉載自互聯網,具體來源未知,或在文章中已說明來源,若有權利人發現,請聯系我們更正。本站尊重原創,轉載文章僅為傳遞更多信息之目的,并不意味著贊同其觀點或證實其內容的真實性。如其他媒體、網站或個人從本網站轉載使用,請保留本站注明的文章來源,并自負版權等法律責任。如有關于文章內容的疑問或投訴,請及時聯系我們。我們轉載此文的目的在于傳遞更多信息,同時也希望找到原作者,感謝各位讀者的支持!

本文鏈接:http://www.tondou.cn/post/1806.html

猜你喜歡

石南

暫無個人介紹

1819 文章
2 頁面
0 評論
589 附件
石南最近發表
最新文章
文章推薦
隨機文章
熱門標簽
側欄廣告位
ChatGPT賬號購買