推理型AI搜索是近期AI應用領域比較火的方向之一。國內的AI廠商,如月之暗面的Kimi推出了Kimi探索版,智譜AI推出了AI搜索智能體,360AI則是在原有的360AI搜索的基礎上增加了慢思考模式。國外的AI玩家,如AI搜索的領頭羊Perplexity,也在這兩天在Pro Search中增加了能夠自動運行的推理模式(Reasoning Mode)。
推理型AI搜索源自于OpenAI發布的推理模型o1.在o1中,OpenAI內置了一個被稱為“內部思維鏈(Internal Chain of Thought)”的推理邏輯,對于復雜的任務,該模型會先生成推理鏈條進行自我推理,然后再用逐個擊破的思想一步步得出回答。
推理型AI搜索也是基于這個思路。搜索作為AI模型應用的一大熱門領域,屬于比較高頻的使用場景。而在推理型AI搜索誕生前,傳統的AI搜索對于稍微復雜一些的問題往往無法勝任。推理讓AI搜索看到了進化的方向。面對復雜問題,比如僅憑搜索信息得不到直接的答案的問題,推理型AI搜索可以先讓模型“思考”,分析問題,拆解為數個子問題,然后逐個解決子問題,最后還可以加上一個在AI Agent中常用的“反饋(Reflection)”機制,以讓模型檢查并優化回答的質量。
從這一點來看,推理型AI搜索本質上可以看作是一個大號的AI Agent(智能體)。
測評問題
本次測試對象由于都是國內的AI搜索工具,我們先測試中文互聯網內的問題。
提示詞:全面回顧A股歷史上的牛市。
結論
先上結論。
內容全面性:360AI搜索的回答最為全面,涵蓋了牛市的各個方面;智譜AI的回答次之,提供了主要數據;Kimi探索版的回答相對簡潔。
結構和邏輯性:三者中,360AI搜索的結構最為嚴謹,層次分明;Kimi探索版的回答簡潔明了;智譜AI的回答則偏向于數據羅列。
分析深度:360AI搜索對牛市的分析最為深入,涵蓋了市場環境和規律等;Kimi探索版和智譜AI的分析相對簡單。
數據和事實準確性:智譜AI和360AI搜索提供了較多具體數據,但需注意數據的一致性和準確性;Kimi探索版的數據相對較少。
可讀性:Kimi探索版的回答簡潔,適合快速閱讀;智譜AI的回答數據密集,適合對數字敏感的讀者;360AI搜索的回答信息量大,適合深入研究。
Kimi探索版
Kimi探索版是基于Kimi原有的聯網搜索工具的一個升級版本。關于其詳細信息可以看我這篇文章:《『深度分析』Kimi版o1來了!Kimi探索版全面解讀!》。
Kimi探索版針對“全面回顧A股歷史上的牛市”這個問題的回答如下。完整版回答文字過長,所以這里放上回答的截圖。
Kimi點評
優點:
結構清晰,層次分明:Kimi的回答將A股歷史上的牛市分為六個主要階段,每個階段都有明確的標題和時間段,條理清晰,最易讀,便于理解和記憶。
內容精煉,重點突出:每個階段都包含背景、特點和結果三個部分,信息簡潔明了,抓住了每次牛市的核心要點。
總結概括到位:在結尾處對A股牛市的整體特征進行了總結,強調了政策和資金作為主要驅動因素的重要性。
不足:
時間段劃分存在交叉:將1996-2001年定義為“政策牛市”,而同時又將1999-2001年定義為“5.19行情”,這可能會引起混淆,時間段劃分需更嚴謹。
細節描述略顯不足:對于每次牛市的具體細節和影響,描述過于簡略,缺乏深入的分析和數據支持。(這一點和我在上一篇文章里的測評結果一致,都有著分析不夠深入的缺點)
智譜AI搜索智能體
智譜推出的推理型AI搜索位于智譜智能體——AI搜索。
智譜AI搜索智能體回答如下。
智譜點評
優點:
全面性強:回答羅列了A股自1990年以來的九次主要牛市,覆蓋了歷史上的重要階段。
數據詳實:每次牛市都提供了具體的漲幅、持續時間(時間甚至精確到日)和指數點位,數據豐富。
原因分析簡明:對每次牛市的主要推動原因進行了簡要說明,幫助讀者了解背后的驅動因素。
不足:
缺乏深入分析:和前面的Kimi一樣,雖然提供了數據和原因,但對每次牛市的特點、影響等缺乏更深入的探討。從回答來看,僅是對事實的羅列,而深入分析的回答內容太少。
缺少整體總結:在列舉完各次牛市后,沒有對A股牛市的整體規律或特征進行總結和概括。
數據源不夠多:相比Kimi的41個網頁,360AI搜索的27篇資料,智譜引用的數據源是最少的,僅有14個搜索來源,閱讀了5個網頁。豐富的數據源是回答質量的基礎,在這一點,智譜還需要加強。比如智譜的回答中提到最后一個牛市是2019年初至今,這一點回答明顯是錯誤的(A股向來是牛短熊長,和美股相反,何來5年多的牛市?)。
360AI搜索慢思考模式
360AI搜索,背靠原本的360搜索引擎,曾一度成為國內AI工具的月活第一名。推理型AI搜索則作為一個新模式——慢思考模式出現,可以在360AI搜索輸入框下方看到入口。
360AI搜索慢思考模式回答如下。考慮到360AI搜索回答篇幅過長,隱去了慢思考模式的思維鏈。
360AI搜索點評
優點:
內容詳盡全面:回答不僅列舉了各次牛市,還包括了牛市的持續時間、漲幅、推動因素、政策影響、市場環境分析、規律特點等,多角度、多層次地進行了闡述。這一點,360AI搜索做的最好,不僅指出了牛市的各項信息,還進行了多方面總結。
深入分析:對牛市的推動因素、政策影響、市場環境等進行了深入的分析,體現了較高的專業水平。
總結歸納:對牛市的特點和影響進行了綜合分析,有助于讀者全面理解A股市場的歷史規律。
不足:
信息量較大,可能造成閱讀負擔:內容詳盡雖然是優點,但過多的信息可能會讓讀者感覺冗長,影響閱讀體驗。
部分數據需核實:例如,提到“六次牛市的平均持續時間約為17.8個月”,但前文列舉了八次牛市,數據前后需一致。其次,360AI搜索關于牛市的總結僅截止到了2015年,應該是受到了信息源的影響,2015年后的事情只字未提。
本文鏈接:http://www.tondou.cn/post/1779.html ,轉載需注明文章鏈接來源:http://www.tondou.cn/
- 喜歡(11)
- 不喜歡(1)