石南AI工具導(dǎo)航
登錄
網(wǎng)站目錄

使用DeepSeek和LKE構(gòu)建個(gè)人和企業(yè)大模型知識(shí)庫!

石南10452025-02-15 21:56:50

大模型除了好玩之外有啥用?

其中一個(gè)很好的應(yīng)用方向就是構(gòu)建基于大模型的知識(shí)庫

無論是個(gè)人還是企業(yè),無論生活還是工作,在信息大爆炸的時(shí)代,我們都積累了大量的信息(文檔)。如何高效檢索,成了一個(gè)大問題。

傳統(tǒng)知識(shí)庫的檢索方式往往比較弱,只能基于關(guān)鍵詞檢索,返回結(jié)果也比較死板。

而結(jié)合了大模型強(qiáng)大的語意理解能力之后,檢索體驗(yàn)和效率就會(huì)有巨大的飛躍。

今天結(jié)合大模型知識(shí)引擎LKE,來嘗試創(chuàng)建一個(gè)自己的知識(shí)庫應(yīng)用

使用DeepSeek和LKE構(gòu)建個(gè)人和企業(yè)大模型知識(shí)庫! 第1張

這個(gè)應(yīng)用主要是實(shí)現(xiàn)的功能就是,把各類文檔制作成知識(shí)庫,然后通過 DeepSeek 進(jìn)行快速高效檢索和呈現(xiàn)。

文章主要是分為兩塊:一個(gè)是如何制作,一個(gè)是效果測(cè)試。

首先,我們來快速創(chuàng)建一個(gè)知識(shí)庫應(yīng)用。

關(guān)于這個(gè)大模型知識(shí)引擎 LKE,在之前的兩篇文章中已經(jīng)提到過。就不做過多介紹了。

使用DeepSeek和LKE構(gòu)建個(gè)人和企業(yè)大模型知識(shí)庫! 第2張

直接根據(jù)這個(gè)網(wǎng)址打開這個(gè)平臺(tái)就可以了。

https://lke.cloud.tencent.com/lke

第一次使用,注冊(cè),認(rèn)證,可能要點(diǎn)時(shí)間,但是并沒有門檻,都可以快速通過。目前這個(gè)階段,全部可以免費(fèi)體驗(yàn),是0成本學(xué)習(xí)技能的好時(shí)候。

1.創(chuàng)建應(yīng)用

進(jìn)入大模型知識(shí)引擎之后的第一步,是創(chuàng)建一個(gè)應(yīng)用。

使用DeepSeek和LKE構(gòu)建個(gè)人和企業(yè)大模型知識(shí)庫! 第3張

在應(yīng)用管理中,點(diǎn)擊新建應(yīng)用,設(shè)置圖標(biāo)和輸入應(yīng)用名稱,點(diǎn)擊新建。

2.切換模型

應(yīng)用創(chuàng)建完成之后,就需要進(jìn)行具體的設(shè)置了,首先是切換模型

使用DeepSeek和LKE構(gòu)建個(gè)人和企業(yè)大模型知識(shí)庫! 第4張

根據(jù)上圖操作,將生成模型,切換成 DeepSeek-R1.這樣就能用上 R1 強(qiáng)大的中文理解和推理能力了。

這里的思考模型,主要影響意圖識(shí)別的效果。

這里的生成模型,主要用于閱讀理解和答案生成。

R1 和 V3 的區(qū)別:

R1是強(qiáng)化學(xué)習(xí)(RL)驅(qū)動(dòng)的推理模型,在數(shù)學(xué)、代碼和推

理任務(wù)中與 OpenAl-01 表現(xiàn)相當(dāng)。與DeepSeek助

手深度思考模式為同款模型

V3是擁有6710億參數(shù)的混合專家(MoE)語言模型,采

用多頭潛在注意力(MLA)和 DeepSeekMoE 架

構(gòu),結(jié)合無輔助損失的負(fù)載平衡策略,優(yōu)化推理和

訓(xùn)練效率。

3.創(chuàng)建知識(shí)庫

點(diǎn)擊頂部的菜單,切換到知識(shí)管理界面。

這個(gè)界面主要就是管理各種文檔。

知識(shí)庫的類型這里其實(shí)還有兩個(gè)大類。

一個(gè)是文檔類。

適合大量文檔的場(chǎng)景。

使用DeepSeek和LKE構(gòu)建個(gè)人和企業(yè)大模型知識(shí)庫! 第5張

一個(gè)是問答類

問答類主要是一問一張,特別適合那種問答場(chǎng)景。

使用DeepSeek和LKE構(gòu)建個(gè)人和企業(yè)大模型知識(shí)庫! 第6張

我們以文檔為例子,開始創(chuàng)建知識(shí)庫。

所謂知識(shí)庫,就是很多知識(shí)聚集在一起就成了知識(shí)庫。而知識(shí)具體的載體就是各種文件或者在線網(wǎng)頁

點(diǎn)擊導(dǎo)入功能,可以從網(wǎng)頁或者本地文件中導(dǎo)入。

網(wǎng)頁導(dǎo)入

使用DeepSeek和LKE構(gòu)建個(gè)人和企業(yè)大模型知識(shí)庫! 第7張

只需要輸入一個(gè)網(wǎng)址,點(diǎn)擊獲取網(wǎng)頁內(nèi)容就可以了。比如我貼了一個(gè)關(guān)于“iPhone 16 Pro Max - 技術(shù)規(guī)格” 的網(wǎng)址。讓他抓取詳細(xì)的參數(shù)信息。

導(dǎo)入文檔

使用DeepSeek和LKE構(gòu)建個(gè)人和企業(yè)大模型知識(shí)庫! 第8張

點(diǎn)擊箭頭區(qū)域或者直接把文件拖動(dòng)到這個(gè)區(qū)域,然后點(diǎn)擊導(dǎo)入文件,就可以了。

目前支持的文檔類型下:

文檔支持pdf、doc、docx、ppt、pptx,單個(gè)文件不超過200MB;

xlsx、xls、md、txt、csv,單個(gè)文件不超過20MB;

圖片支持jpg、png、jpeg,單個(gè)文件不超過50MB

基本涵蓋了常見文檔。

我這里只選了 txt,pdf來做測(cè)試。選了幾本金庸小說,然后選了幾個(gè)電腦主板的PDF文檔。

知識(shí)庫上傳完成之后,需要經(jīng)過幾個(gè)階段的處理。

主要包括解析,學(xué)習(xí),待發(fā)布。(還有一個(gè)審核~~)

這個(gè)過程和上傳內(nèi)容的字符量有關(guān)系。測(cè)試階段,不要上傳太大的文件,會(huì)消耗很多 token配額。

等文檔狀態(tài)變成已經(jīng)學(xué)習(xí),待發(fā)布的時(shí)候,就證明知識(shí)庫已經(jīng)就位了,可以使用了。

4.啟用知識(shí)庫

回到應(yīng)用配置界面,啟用一下知識(shí)庫。其實(shí),這兩項(xiàng)都是默認(rèn)開啟的。

使用DeepSeek和LKE構(gòu)建個(gè)人和企業(yè)大模型知識(shí)庫! 第9張

右上角還有一個(gè)高級(jí)設(shè)置

使用DeepSeek和LKE構(gòu)建個(gè)人和企業(yè)大模型知識(shí)庫! 第10張

點(diǎn)擊高級(jí)設(shè)置之后,可以調(diào)整檢索策略,文檔設(shè)置,問答設(shè)置

檢索策略

混合檢索:同時(shí)執(zhí)行關(guān)鍵詞檢索和向量檢索,推薦在需要對(duì),字符串和語義關(guān)聯(lián)的場(chǎng)景下使用,綜合效果更優(yōu)。

語意檢索:推薦query與文本切片重疊詞匯少,需要語義匹配的場(chǎng)景

文檔設(shè)置

文檔召回?cái)?shù)量:檢索返回的最高匹配度的N個(gè)文檔片段

文檔檢索匹配度:根據(jù)設(shè)置的匹配度,將找到的文本片段返回給大模型,作為回復(fù)參考。值越低,意味著更多的片段被召回,但也可能影響準(zhǔn)確性,低于匹配度的內(nèi)容將不會(huì)被召回。

問答設(shè)置

問答回復(fù)方式:直接回復(fù)和潤(rùn)色后回復(fù)。

問答召回?cái)?shù)量:同上

問答檢索匹配度:同上

可以根據(jù)實(shí)際需求,和實(shí)際測(cè)試情況,調(diào)整這些參數(shù)。剛開始可以全部使用默認(rèn)配置。

5.測(cè)試知識(shí)庫

當(dāng)文檔學(xué)習(xí)完成,參數(shù)設(shè)置完畢,就可以開始測(cè)試你的知識(shí)庫應(yīng)用了。

我就針對(duì) iPhone16Promax提一個(gè)問題。

原來網(wǎng)頁信息如下:

使用DeepSeek和LKE構(gòu)建個(gè)人和企業(yè)大模型知識(shí)庫! 第11張

問答情況如下:

使用DeepSeek和LKE構(gòu)建個(gè)人和企業(yè)大模型知識(shí)庫! 第12張

點(diǎn)擊參考來源,可以查看原文片段

使用DeepSeek和LKE構(gòu)建個(gè)人和企業(yè)大模型知識(shí)庫! 第13張

首先,我問的是iPhone16,沒加 promax 這個(gè)后綴。一個(gè)是我偷懶了,一個(gè)是測(cè)試一下它能否基于文檔找到 promax 的信息。

其次,我沒問“外觀”這個(gè)關(guān)鍵詞,而是直接問顏色。也是要考驗(yàn)它是否直接做關(guān)鍵詞匹配,還是有自己的理解能力。

從思考過程來看,首先它找對(duì)了位置,其次它還想了一下 iPhone16 和 promax 的問題。

最終的回答完全準(zhǔn)確,而且做了一個(gè)備注(這是 iPhone16promax 的規(guī)格)。

雖然這個(gè)問題看似很簡(jiǎn)單,但是已經(jīng)可以體驗(yàn)大模型加持后的檢索能力了。

更多測(cè)試,我們留在文末,現(xiàn)在先把流程走完。

6.發(fā)布知識(shí)庫

當(dāng)你感覺測(cè)試得差不多了,就可以點(diǎn)擊右上角的發(fā)布了。

使用DeepSeek和LKE構(gòu)建個(gè)人和企業(yè)大模型知識(shí)庫! 第14張

點(diǎn)擊發(fā)布的意義,主要在于,發(fā)布之后,當(dāng)前的配置就對(duì)后續(xù)的接口生效了。如果不發(fā)布,那么所有修改只是在測(cè)試界面有效,不會(huì)影響已發(fā)布的應(yīng)用。

發(fā)布這個(gè)過程很快就會(huì)完成。

完成之后會(huì)有提示。

然后可以去發(fā)布管理->調(diào)用信息界面。

使用DeepSeek和LKE構(gòu)建個(gè)人和企業(yè)大模型知識(shí)庫! 第15張

獲取體驗(yàn)鏈接,可以直接立即體驗(yàn),也可以分享鏈接,分享二維??

7.體驗(yàn)知識(shí)庫

復(fù)制上面的鏈接,就可以打開一個(gè)單獨(dú)對(duì)話頁面了。

使用DeepSeek和LKE構(gòu)建個(gè)人和企業(yè)大模型知識(shí)庫! 第16張

界面很簡(jiǎn)潔,可以發(fā)送問題,也可以發(fā)送圖片,輸入框運(yùn)行輸入 12000 個(gè)字。如果是個(gè)人使用,其實(shí)用這個(gè)界面就可以了。

結(jié)合上一期講的DeepSeekR1 聯(lián)網(wǎng)功能,別看操作簡(jiǎn)單,沒花一分錢,但是功能卻很給力了。

8.后續(xù)操作

可以根據(jù)應(yīng)用接口和Appkey 等信息,接入任何系統(tǒng)。比如網(wǎng)址,桌面軟件,手機(jī)APP。

由于這是針對(duì)企業(yè)用戶的服務(wù),一般來說騰訊不會(huì)也不敢偷你數(shù)據(jù),對(duì)于數(shù)據(jù)安全級(jí)別不是很高的場(chǎng)景,完全可以通過這種方式快速構(gòu)建個(gè)人或者公司的大模型知識(shí)庫。

除此之外主要是看后續(xù)收費(fèi)情況,貴的話,只能棄了。便宜,就可以直接用起來。

9.更多測(cè)試

在上面的測(cè)試中,我只測(cè)試了從網(wǎng)頁導(dǎo)入的 iPhone 規(guī)格參數(shù)的問題。其實(shí)我還上傳了好幾份電腦主板的用戶手冊(cè),搞了一個(gè)裝機(jī)的分類。

使用DeepSeek和LKE構(gòu)建個(gè)人和企業(yè)大模型知識(shí)庫! 第17張

那么我們就來問一點(diǎn)主板相關(guān)的問題吧。

比如主板上有多少風(fēng)扇接口?

有多少個(gè) SATA口?

有多少個(gè) M2 接口?

支持哪些型號(hào)的CPU

使用DeepSeek和LKE構(gòu)建個(gè)人和企業(yè)大模型知識(shí)庫! 第18張

因?yàn)閮?nèi)部有設(shè)定,如果有文檔,必須先查看文檔,沒有文檔,就大模型自己回答。

那些有參考的文檔的基本就是基于我們自己的數(shù)據(jù)來回答的。由于沒有啟用聯(lián)網(wǎng)功能,所以絕對(duì)可以排除它聯(lián)網(wǎng)查詢這個(gè)資料的可能性。

如果要排除大模型自己的知識(shí)儲(chǔ)備,我們可以自己編一個(gè)數(shù)據(jù)測(cè)一測(cè)它。

下面是我讓 DeepSeekR1編的 iPhone20 的參數(shù):

使用DeepSeek和LKE構(gòu)建個(gè)人和企業(yè)大模型知識(shí)庫! 第19張

然后,開始問相關(guān)問題:

使用DeepSeek和LKE構(gòu)建個(gè)人和企業(yè)大模型知識(shí)庫! 第20張

iPhone20 實(shí)在是太強(qiáng)了??。

300W 磁吸充電,五分鐘充滿。

24GDDR6X 內(nèi)存。

0.8納米180億晶體管

64核心NPU,宙斯引擎,算力 1200TOPS。

......

上面的信息應(yīng)該是全對(duì),一個(gè)字母都不差。

上面的問題都偏理工科,理工科的人也特別需要這中知識(shí)庫。

下面,來點(diǎn)趣味測(cè)試。

聊聊金庸的小說《神雕俠侶》。

使用DeepSeek和LKE構(gòu)建個(gè)人和企業(yè)大模型知識(shí)庫! 第21張

不查不知道,一查嚇一跳。原來尹志平都改名甄志丙了....

想當(dāng)年,看神雕,意難平,就是因?yàn)檫@個(gè)男人。

最后一個(gè)提問,它都思考完了,但就是不給結(jié)果。。。

大家都是成年人,何必呢!!!

這么測(cè)下來,整體效果還是可以的。

主要是實(shí)現(xiàn)過程也很簡(jiǎn)單!

如果,你對(duì)某些問題不滿意,或者想拒絕回答一些問題,也可以在后臺(tái)效果調(diào)優(yōu)功能里面進(jìn)行設(shè)置。

本文主要是是分享一種實(shí)現(xiàn)大模型知識(shí)庫的方案,并作了一些簡(jiǎn)單的測(cè)試。有這方面需求的人,可以根據(jù)自己的數(shù)據(jù)和使用場(chǎng)景,去試試看。


本文鏈接:http://www.tondou.cn/post/1825.html ,轉(zhuǎn)載需注明文章鏈接來源:http://www.tondou.cn/

分享到:
標(biāo)簽:DeepSeekAI
  • 不喜歡(2
本文轉(zhuǎn)載自互聯(lián)網(wǎng),具體來源未知,或在文章中已說明來源,若有權(quán)利人發(fā)現(xiàn),請(qǐng)聯(lián)系我們更正。本站尊重原創(chuàng),轉(zhuǎn)載文章僅為傳遞更多信息之目的,并不意味著贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性。如其他媒體、網(wǎng)站或個(gè)人從本網(wǎng)站轉(zhuǎn)載使用,請(qǐng)保留本站注明的文章來源,并自負(fù)版權(quán)等法律責(zé)任。如有關(guān)于文章內(nèi)容的疑問或投訴,請(qǐng)及時(shí)聯(lián)系我們。我們轉(zhuǎn)載此文的目的在于傳遞更多信息,同時(shí)也希望找到原作者,感謝各位讀者的支持!

本文鏈接:http://www.tondou.cn/post/1825.html

猜你喜歡

石南

暫無個(gè)人介紹

1819 文章
2 頁面
0 評(píng)論
589 附件
石南最近發(fā)表
最新文章
文章推薦
隨機(jī)文章
熱門標(biāo)簽
側(cè)欄廣告位
ChatGPT賬號(hào)購買