Open AI的o1滿血版翻身當爸爸，“強化微調”直接PK頂尖專家，奧特曼還是會玩！

石南12432024-12-07 16:55:21

前兩天奧特曼放出消息說OpenAI將連續12天直播大放送，我還特意發了篇文章，充滿期待!

我知道好多AI圈子里的人別說GPT5、sora了，AGI我們都準備好迎接了，但是直播是啥情況呢?

Open AI的o1滿血版翻身當爸爸，“強化微調”直接PK頂尖專家，奧特曼還是會玩！第1張

15分鐘極速直播就一個o1滿血版，還在這炫耀!!!

Open AI的o1滿血版翻身當爸爸，“強化微調”直接PK頂尖專家，奧特曼還是會玩！第2張

看到很多人都在狂噴這次發布會，號稱史上最寒酸的發布會，有一位網友，對于產品的定價，也算是說出了大家的心聲~

Open AI的o1滿血版翻身當爸爸，“強化微調”直接PK頂尖專家，奧特曼還是會玩！第3張

不過，作為人工智能領域的科技巨頭，OpenAI還是有點東西的，這兩天講了點啥呢?

|o1 模型：性能的實質性提升

相較于之前的預覽版本，o1 模型在多個關鍵維度上實現了明顯進步：

1.智能能力的提升OpenAI 通過數學競賽題、編程挑戰和科學難題的測試，展示了 o1 模型在基礎智能能力上的顯著進步。

測試數據顯示，模型出現重大錯誤的概率較預覽版**降低了約34%**，這意味著在日常使用場景中，模型的可靠性和準確性都得到了實質性提升。

Open AI的o1滿血版翻身當爸爸，“強化微調”直接PK頂尖專家，奧特曼還是會玩！第4張

2.響應速度的優化

針對此前用戶反饋"慢思考"的詬病，o1 模型在響應機制上做出了重大調整。通過智能判斷問題復雜程度，模型能夠對簡單問題給出快速響應，同時在面對復雜問題時仍保持深入思考的能力。OpenAI 內部研究表明，模型整體思考速度較預覽版提高了約50%。

Open AI的o1滿血版翻身當爸爸，“強化微調”直接PK頂尖專家，奧特曼還是會玩！第5張

3.多模態能力的擴展

圖像識別是 o1 模型的一個重要突破。在發布會現場演示中，研究人員上傳了一張手繪的熱力學草圖，模型成功識別并進行多模態推理。

雖然看起來這么厲害，但天底下哪有免費的午餐，說話間就帶出了一個比Plus訂閱貴十倍的新訂閱計劃……

Open AI的o1滿血版翻身當爸爸，“強化微調”直接PK頂尖專家，奧特曼還是會玩！第6張

奧特曼，你當我們是韭菜嗎？

不過也能看出來，看來OpenAI也是真缺錢了~

他們也說了，200美元的月度訂閱價格并非面向普通消費者，而是專門針對對人工智能有剛性需求的高階用戶和專業團隊。

Pro 版本的核心價值

無限制使用高級模型

全天候高級語音模式

模型結果可靠性的微小提升

優先體驗最新技術特性

不過勵志做科研的人員，值得嘗試一下~

|強化微調

第二天，奧特曼直接不來了，讓團隊繼續上演15分鐘小課堂，講了o1mini的強化微調。

Open AI的o1滿血版翻身當爸爸，“強化微調”直接PK頂尖專家，奧特曼還是會玩！第7張

這個具體有什么用呢?

一句話說，就是以后大家可以用自己的數據集把o1從高中水平升級到你所在領域的博士專家級水平。

現場也是有一位遺傳病專家演示了經過微調之后的omini模型，得分上升了80%，甚至比滿血版的o1還要強。那這個強化微調到底是什么呢?

Open AI的o1滿血版翻身當爸爸，“強化微調”直接PK頂尖專家，奧特曼還是會玩！第8張

首先聽名字肯定用的是強化學習方法，但是跟原來的微調有什么區別呢?

想象一下，我們有兩種方式來教一個人如何烹飪。

Open AI的o1滿血版翻身當爸爸，“強化微調”直接PK頂尖專家，奧特曼還是會玩！第9張

傳統微調的方式就像是這樣：你給一個新手廚師看很多食譜和成品照片，讓他們仔細觀察這些成功的菜肴是什么樣子的，但并不讓他們親自下廚。

你只是讓他們看，希望他們能從這些食譜和成品照片中自己領悟出烹飪的技巧。

強化微調的方式則不同：你給新手廚師一些基本的食材和烹飪工具，讓他們自己嘗試做菜。每次他們做完一道菜后，你嘗一嘗，然后告訴他們這道菜做得怎么樣，比如這道菜的味道不錯，但是火候掌握得不夠好。

廚師就會根據你的反饋來調整自己的烹飪方法，強化做得好的地方，改進做得不好的地方。這樣，他們可能只需要做幾次菜就能掌握烹飪技巧，而且學得更快、更好。

但是，強化微調并不是對所有事情都有效。比如學習園藝，可能多觀察植物的生長、多澆水施肥會更有幫助。

而在需要邏輯推理和系統思考的任務上，比如設計一座花園，你可能需要自己先規劃，然后讓有經驗的園丁來給你提建議。

所以，強化微調更適合那些需要專業知識和系統性思考的領域，比如法律、醫療、建筑設計、園藝規劃、烹飪藝術等。

對于簡單的模仿和重復性工作，比如模仿某個人的簽名或者簡單的流水線作業，可能就不是那么適用。

現在它還只面向一些高校、企業和開發者開放測試。

兩天的發布會不僅僅是一次技術更新，更是 OpenAI 在人工智能商業化道路上的又一次嘗試。200美元的 Pro 版本，實際上是在測試市場：到底有多少用戶愿意為"世界上最聰明"的大模型付費?

而強化微調，似乎又在通往AGI的道路上前進了一小步~

好了，暫時就說這么多，另外，Altman又放出了一個新的信號……

Open AI的o1滿血版翻身當爸爸，“強化微調”直接PK頂尖專家，奧特曼還是會玩！第10張

Open AI

本文鏈接：http://www.tondou.cn/post/1806.html ,轉載需注明文章鏈接來源：http://www.tondou.cn/

分享到：

標簽：Open AI ChatGPT

喜歡（10）
不喜歡（2）

本文轉載自互聯網，具體來源未知，或在文章中已說明來源，若有權利人發現，請聯系我們更正。本站尊重原創，轉載文章僅為傳遞更多信息之目的，并不意味著贊同其觀點或證實其內容的真實性。如其他媒體、網站或個人從本網站轉載使用，請保留本站注明的文章來源，并自負版權等法律責任。如有關于文章內容的疑問或投訴，請及時聯系我們。我們轉載此文的目的在于傳遞更多信息，同時也希望找到原作者，感謝各位讀者的支持！

本文鏈接：http://www.tondou.cn/post/1806.html