石南AI工具導航
登錄
網站目錄

『深度分析』Kimi版o1來了!Kimi探索版全面解讀!

石南13062024-10-12 20:26:31

推理者(Reasoners),位于OpenAI提出的從AI到AGI五級分類系統中的第二階段。推理者與基礎AI(Emerging AGI)——當前大多數AI系統——的一大區別在于其推理能力以及復雜問題的解決能力。推理AI不依賴外部信息源來獲取答案,而是通過已有的知識及內部推理來解決復雜問題。這一點是不是和我們人類的認知-學習-應用一樣,先學習現有知識,然后根據這些知識基礎來構建推理鏈條從而應用到現實問題上。

OpenAI不久前發布的推理模型o1讓所有人看到了AI模型進化的另一個方向。作為一款AI模型,它的知識水平和推理能力與博士級別相當,更是在國際數學奧林匹克(IMO)考試中達到了驚人的83%正確率,其“智商”可見一斑。

國內的AI廠商摩拳擦掌,紛紛跟進,以Kimi和智譜為首,推出了類似的推理型AI產品。本篇文章的主角就是由月之暗面于10月11日正式推出的推理AI搜索產品:Kimi探索版。

『深度分析』Kimi版o1來了!Kimi探索版全面解讀! 第1張

Kimi探索版是什么?簡單來說,Kimi探索版是一款融合了類似o1模型的推理功能(內部思維鏈)的AI搜索工具。本質上它是一個AI搜索工具,一款產品,而非一個AI模型。這個AI搜索工具和AI Agent一樣,擁有推理(Reasoning)、規劃(Planning)、工具調用(Tool Use)和反饋(Reflection)的能力。

『深度分析』Kimi版o1來了!Kimi探索版全面解讀! 第2張

推理(Reasoning)和規劃(Planning):推理規劃是我們人類解決復雜問題的第一步,AI也是如此。面對一個復雜問題,我們通常先對問題進行全面分析,拆解為多個子問題,然后規劃出解決路徑。這種思維方式被稱作“思維鏈(ChAIn of Thought)”。OpenAI的o1模型為什么有如此強大的推理能力,就是因為其內部思維鏈。

工具調用(Tool Use):LLM模型本身不具備第三方工具調用的能力,如聯網搜索,但AI Agent(智能體)可以。Kimi探索版就像是這么一個AI Agent,它擁有調用外部工具的能力,如Web搜索引擎,這樣使得模型能夠處理其自身能力范圍之外的任務。

反饋(Reflection):反饋是AI Agent設計中的一種重要方式:通過自我反思和迭代改進來提高AI模型對于復雜任務執行能力。根據月之暗面官方的介紹,Kimi探索版在AI搜索的最后一步也擁有反饋和自我修正的能力:對生成的結果進行反思,檢查信息是否存在遺漏或錯誤,并在必要時補充或修改答案。這其實不難理解,因為Kimi探索版其實就是一個偽裝的AI Agent。

為什么需要Kimi探索版?主要原因之一就是當前大多數AI搜索工具都還停留在初級搜索階段。何為初級搜索階段?就是雖然能夠提供較為全面的信息檢索,但依然局限于關鍵詞匹配與基礎的文本分析。綜合來看,只能滿足簡單的信息搜索需求,比如查詢天氣,查詢百科知識,查詢歷史事件等。而面對復雜問題時,傳統的AI搜索工具很容易陷入信息拼湊的局限,給出的結果往往信息量大但實用性低,用戶還需自行從冗長的結果中篩選有用的信息。比如旅行規劃,得到的結果往往是搜索信息的簡單拼湊,答案缺乏深度推理思考。

Kimi探索版可以算是AI搜索PLUS,加入了推理能力的增強型AI搜索工具。這算是推理模型/能力在AI搜索方向一個非常好的嘗試和應用了。

附上Kimi探索版產品負責人很自信的說法:“如果Kimi搜不到的信息,那大概率用戶也很難自己通過傳統搜索引擎找到。”

如何體驗Kimi探索版

https://kimi.moonshot.cn/

目前Kimi探索版只支持Web網頁端,手機App端暫時沒有上線該功能。并且,Kimi探索版作為一個高級功能,目前每人每天有著5次的使用限制。這個限制算是只能嘗個鮮了。

『深度分析』Kimi版o1來了!Kimi探索版全面解讀! 第3張

按照上面的鏈接打開Kimi的網頁,首頁就可以看到Kimi探索版的推薦。共有兩種方式進入探索版,一種是在輸入框里輸入斜杠字符:“/”,然后點擊Enter回車鍵。

『深度分析』Kimi版o1來了!Kimi探索版全面解讀! 第4張

第二種進入Kimi探索版的方式是打開輸入框左下角探索版的開關,即可直接進入探索版。

『深度分析』Kimi版o1來了!Kimi探索版全面解讀! 第5張

Kimi探索版初體驗

要想測試Kimi探索版,需要提問一個比較復雜的搜索問題。怎么算復雜?用傳統的搜索引擎一步查詢不到結果的都可以算作是復雜任務。比如下面這個。

如何應對2024年中國新能源汽車市場競爭加劇的趨勢?各大廠商的戰略是什么?

對于這個問題,傳統的搜索引擎肯定是搞不定的,一來需要搜索的內容過多,二來不但需要搜索到內容,還需要對其進行整合、分析,最終得出答案。

Kimi探索版給出的答案是這樣的。

『深度分析』Kimi版o1來了!Kimi探索版全面解讀! 第6張

點評

綜合來看,信息檢索的速度很快,符合Kimi官方對于這個新功能的描述。在幾十秒閱讀了127個網頁。Kimi探索版給出的信息比較詳盡且覆蓋面廣,共提供了12家主要新能源汽車廠商的戰略概述,基本涵蓋了所有國內外的領先企業。信息源的及時性和準確性也還可以,基本都是來自2024年的行業數據和新聞報道。

但從上面的回答也可以看出,雖然Kimi探索版是把檢索到的海量信息進行了匯總整理,但缺乏深入的行業趨勢分析,對于每一條戰略分析的深度有待加強,目前看起來僅僅是對信息的堆砌,每個戰略一句話就帶過了。此外,雖然給出了各大廠商的戰略,但不同廠商的策略之間的競爭性和差異性沒有進行足夠的對比分析。因此,在這個測試案例中,Kimi探索版的推理能力沒有特別突出的表現。


本文鏈接:http://www.tondou.cn/post/1773.html ,轉載需注明文章鏈接來源:http://www.tondou.cn/

分享到:
標簽:kimiAI
  • 不喜歡(3
本文轉載自互聯網,具體來源未知,或在文章中已說明來源,若有權利人發現,請聯系我們更正。本站尊重原創,轉載文章僅為傳遞更多信息之目的,并不意味著贊同其觀點或證實其內容的真實性。如其他媒體、網站或個人從本網站轉載使用,請保留本站注明的文章來源,并自負版權等法律責任。如有關于文章內容的疑問或投訴,請及時聯系我們。我們轉載此文的目的在于傳遞更多信息,同時也希望找到原作者,感謝各位讀者的支持!

本文鏈接:http://www.tondou.cn/post/1773.html

猜你喜歡

石南

暫無個人介紹

1819 文章
2 頁面
0 評論
589 附件
石南最近發表
最新文章
文章推薦
隨機文章
熱門標簽
側欄廣告位
ChatGPT賬號購買