注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)操作系統(tǒng)大模型RAG應(yīng)用開發(fā):構(gòu)建智能生成系統(tǒng)

大模型RAG應(yīng)用開發(fā):構(gòu)建智能生成系統(tǒng)

大模型RAG應(yīng)用開發(fā):構(gòu)建智能生成系統(tǒng)

定 價(jià):¥99.00

作 者: 凌峰
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787302685982 出版時(shí)間: 2025-04-01 包裝: 平裝-膠訂
開本: 16開 頁數(shù): 字?jǐn)?shù):  

內(nèi)容簡介

  《大模型RAG應(yīng)用開發(fā):構(gòu)建智能生成系統(tǒng)》系統(tǒng)介紹檢索增強(qiáng)生成(RAG)技術(shù)的核心概念、開發(fā)流程和實(shí)際應(yīng)用?!洞竽P蚏AG應(yīng)用開發(fā):構(gòu)建智能生成系統(tǒng)》共分為11章,第1~3章詳細(xì)介紹RAG開發(fā)的基礎(chǔ),包括環(huán)境搭建、常用工具和模塊,幫助讀者從零開始理解RAG系統(tǒng)的工作原理與開發(fā)技巧;第4~8章聚焦RAG系統(tǒng)的具體搭建,從向量數(shù)據(jù)庫的創(chuàng)建、文本的向量化,到如何構(gòu)建高效的檢索增強(qiáng)模型,為開發(fā)RAG應(yīng)用奠定基礎(chǔ);第9~11章通過實(shí)際案例,包括企業(yè)文檔問答系統(tǒng)、醫(yī)療文獻(xiàn)檢索系統(tǒng)和法律法規(guī)查詢助手的實(shí)際開發(fā),幫助讀者在特定領(lǐng)域深入理解和應(yīng)用RAG技術(shù)?!洞竽P蚏AG應(yīng)用開發(fā):構(gòu)建智能生成系統(tǒng)》適合RAG技術(shù)初學(xué)者、大模型和AI研發(fā)人員、數(shù)據(jù)分析和挖掘工程師,以及高年級(jí)本科生和研究生閱讀,也可作為培訓(xùn)機(jī)構(gòu)和高校相關(guān)課程的教學(xué)用書或參考書。

作者簡介

  凌峰,博士,目前就職于某985高校,長期從事機(jī)器學(xué)習(xí)、人工智能、計(jì)算機(jī)視覺與大模型領(lǐng)域的研發(fā)與教學(xué),在模型優(yōu)化、訓(xùn)練加速、數(shù)據(jù)驅(qū)動(dòng)算法開發(fā)等方面有深刻見解,參與并主導(dǎo)多項(xiàng)相關(guān)科研項(xiàng)目。

圖書目錄

第 1 章  搭建RAG開發(fā)環(huán)境 1
1.1  Python開發(fā)環(huán)境搭建 1
1.1.1  虛擬環(huán)境的創(chuàng)建管理 1
1.1.2  IDE的選擇與工作流的搭建 5
1.1.3  依賴庫安裝與版本管理 8
1.2  RAG開發(fā)中常用的Python依賴庫 10
1.2.1  數(shù)據(jù)處理庫:Pandas與NumPy 10
1.2.2  自然語言處理工具:NLTK與spaCy 13
1.2.3  向量檢索與模型處理:FAISS與Transformers庫簡介 16
1.3  RAG開發(fā)中常用的外部模塊 20
1.3.1  數(shù)據(jù)采集與預(yù)處理:Requests與BeautifulSoup 20
1.3.2  并行與異步處理:Multiprocessing與Asyncio 24
1.4  RAG與智能體 28
1.4.1  智能體的基本定義與作用 28
1.4.2  智能體的類型:反應(yīng)型、認(rèn)知型與學(xué)習(xí)型 30
1.5  基于RAG的智能體開發(fā)基礎(chǔ) 31
1.5.1  開發(fā)環(huán)境與工具 32
1.5.2  智能體開發(fā)中的關(guān)鍵算法:搜索、優(yōu)化與規(guī)劃 35
1.5.3  智能體的性能評(píng)估與調(diào)試方法 37
1.6  本章小結(jié) 40
1.7  思考題 41
第 2 章  傳統(tǒng)生成與檢索增強(qiáng)生成 42
2.1  生成式AI和RAG的基本概念 42
2.1.1  生成式AI的核心原理與工作機(jī)制 43
2.1.2  生成檢索結(jié)合 45
2.1.3  檢索增強(qiáng)與傳統(tǒng)生成模型的區(qū)別 48
2.2  為何需要對(duì)傳統(tǒng)大模型進(jìn)行檢索增強(qiáng) 51
2.2.1  預(yù)訓(xùn)練大模型的瓶頸 52
2.2.2  RAG在實(shí)時(shí)信息處理中的優(yōu)勢 53
2.3  檢索增強(qiáng)核心:預(yù)訓(xùn)練大模型 53
2.3.1  Transformer架構(gòu)的崛起:語言模型背后的核心引擎 54
2.3.2  從BERT到GPT-4:大模型發(fā)展的重要里程碑 56
2.4  本章小結(jié) 57
2.5  思考題 57
第 3 章  RAG模型的工作原理 59
3.1  檢索模塊與生成模塊 59
3.1.1  檢索模塊的核心功能與數(shù)據(jù)流 59
3.1.2  生成模塊在內(nèi)容創(chuàng)建中的作用 63
3.1.3  檢索與生成的協(xié)同工作機(jī)制 65
3.2  向量檢索:將文本轉(zhuǎn)換為向量 68
3.2.1  文本嵌入的基本原理與技術(shù) 69
3.2.2  高效向量檢索:從相似度到索引優(yōu)化 72
3.2.3  向量檢索在RAG中的實(shí)際應(yīng)用 76
3.3  RAG開發(fā)中常用的生成模型簡介 80
3.3.1  GPT家族:從GPT-2到GPT-4的演進(jìn) 80
3.3.2  BERT與T5:理解與生成的跨模型應(yīng)用 82
3.4  本章小結(jié) 83
3.5  思考題 84
第 4 章  搭建一個(gè)簡單的RAG系統(tǒng) 86
4.1  創(chuàng)建小型向量數(shù)據(jù)庫 86
4.1.1  數(shù)據(jù)準(zhǔn)備與預(yù)處理:搭建數(shù)據(jù)庫的第一步 86
4.1.2  嵌入生成與存儲(chǔ):從文本到向量的轉(zhuǎn)換 89
4.1.3  使用FAISS構(gòu)建檢索索引:實(shí)現(xiàn)高效查詢 92
4.2  利用公開模型實(shí)現(xiàn)簡單的問答系統(tǒng) 96
4.2.1  加載預(yù)訓(xùn)練模型:選擇合適的生成模型 96
4.2.2  檢索與生成模塊的集成:構(gòu)建問答流程 100
4.2.3  測試與優(yōu)化:提升回答的準(zhǔn)確性和一致性 103
4.3  本章小結(jié) 107
4.4  思考題 107
第 5 章  數(shù)據(jù)向量化與FAISS開發(fā) 109
5.1  什么是向量檢索:原理與常用算法 109
5.1.1  向量檢索的基本概念:從相似性到距離度量 109
5.1.2  常用的向量檢索算法:線性搜索與近似最近鄰 113
5.1.3  向量檢索在RAG中的應(yīng)用:增強(qiáng)上下文匹配 116
5.2  使用FAISS構(gòu)建高效的向量檢索系統(tǒng) 119
5.2.1  FAISS索引結(jié)構(gòu)解析:平面索引、倒排索引與產(chǎn)品量化 119
5.2.2  構(gòu)建和訓(xùn)練FAISS索引:提高檢索速度和準(zhǔn)確性 122
5.2.3  FAISS在大規(guī)模數(shù)據(jù)中的優(yōu)化策略:多級(jí)索引與分片 125
5.3  數(shù)據(jù)的向量化:Embedding的生成 128
5.3.1  嵌入生成模型選擇:如何匹配檢索任務(wù)需求 129
5.3.2  文本嵌入的生成與存儲(chǔ):從編碼到持久化 131
5.4  本章小結(jié) 134
5.5  思考題 135
第 6 章  文本檢索增強(qiáng)與上下文構(gòu)建 136
6.1  如何讓生成模型“理解”檢索到的內(nèi)容 136
6.1.1  檢索與生成的無縫銜接:內(nèi)容重構(gòu)與語義理解 136
6.1.2  語義相似度與匹配:提升生成的準(zhǔn)確性 139
6.1.3  從檢索到生成的優(yōu)化路徑:模型理解的增強(qiáng) 141
6.2  上下文的構(gòu)建與傳遞 144
6.2.1  構(gòu)建有效的上下文:信息篩選與組織策略 145
6.2.2  多步上下文傳遞:保持生成內(nèi)容的連貫性 147
6.2.3  上下文優(yōu)化技巧:減少冗余與增加相關(guān)性 150
6.3  多輪對(duì)話與復(fù)雜生成任務(wù)的實(shí)現(xiàn) 154
6.3.1  多輪交互的構(gòu)建:讓生成模型模擬人類對(duì)話 154
6.3.2  長對(duì)話與上下文管理:模型記憶的實(shí)現(xiàn)方法 157
6.3.3  復(fù)雜生成任務(wù)分解:如何逐步實(shí)現(xiàn)多步驟生成 160
6.4  本章小結(jié) 164
6.5  思考題 165
第 7 章  構(gòu)建檢索向量數(shù)據(jù)庫 167
7.1  數(shù)據(jù)的準(zhǔn)備與清洗 167
7.1.1  數(shù)據(jù)質(zhì)量提升:數(shù)據(jù)清洗與規(guī)范化流程 167
7.1.2  數(shù)據(jù)標(biāo)注與分類:構(gòu)建高效檢索的基礎(chǔ) 171
7.2  如何創(chuàng)建和管理向量數(shù)據(jù)庫 175
7.2.1  向量數(shù)據(jù)庫的構(gòu)建步驟:從嵌入到存儲(chǔ) 175
7.2.2  高效管理:向量索引與檢索優(yōu)化 178
7.3  本章小結(jié) 182
7.4  思考題 182
第 8 章  針對(duì)延遲與緩存的模型性能調(diào)優(yōu) 184
8.1  調(diào)整生成與檢索模塊的協(xié)同參數(shù) 184
8.1.1  生成與檢索的平衡:優(yōu)化參數(shù)的核心原則 184
8.1.2  動(dòng)態(tài)參數(shù)調(diào)節(jié):提升響應(yīng)質(zhì)量與精度 187
8.2  縮短RAG系統(tǒng)的響應(yīng)時(shí)間 190
8.2.1  延遲分析與瓶頸定位:加速響應(yīng)的第一步 191
8.2.2  緩存與并行處理策略:實(shí)現(xiàn)高效RAG系統(tǒng) 194
8.3  本章小結(jié) 197
8.4  思考題 197
第 9 章  企業(yè)文檔問答系統(tǒng)的開發(fā) 199
9.1  需求分析與系統(tǒng)設(shè)計(jì) 199
9.1.1  確定問答系統(tǒng)的需求:識(shí)別用戶的主要查詢類型與目標(biāo) 200
9.1.2  系統(tǒng)結(jié)構(gòu)與模塊劃分:明確檢索與生成模塊的協(xié)作方式 201
9.2  搭建向量數(shù)據(jù)庫與檢索模塊 201
9.2.1  數(shù)據(jù)預(yù)處理與向量化:生成高效的嵌入向量 202
9.2.2  構(gòu)建與優(yōu)化索引:提升檢索模塊的查詢速度 204
9.3  生成模塊的集成與模型調(diào)優(yōu) 206
9.3.1  加載與配置生成模型:選擇適合問答系統(tǒng)的生成模型 207
9.3.2  模型優(yōu)化與提示詞調(diào)優(yōu):提高生成內(nèi)容的準(zhǔn)確性與相關(guān)性 209
9.4  系統(tǒng)測試、部署與優(yōu)化 211
9.4.1  測試流程與性能監(jiān)控:確保系統(tǒng)的穩(wěn)定性與響應(yīng)速度 211
9.4.2  企業(yè)環(huán)境的部署與上線:實(shí)現(xiàn)系統(tǒng)在實(shí)際業(yè)務(wù)中的應(yīng)用 214
9.5  本章小結(jié) 222
9.6  思考題 222
第 10 章  醫(yī)療文獻(xiàn)檢索與分析系統(tǒng)的開發(fā) 224
10.1  需求分析與數(shù)據(jù)準(zhǔn)備 224
10.1.1  確定醫(yī)學(xué)文獻(xiàn)檢索需求:識(shí)別用戶查詢重點(diǎn) 225
10.1.2  數(shù)據(jù)收集與清洗:構(gòu)建高質(zhì)量的醫(yī)學(xué)知識(shí)庫 226
10.2  構(gòu)建高效的檢索模塊 232
10.2.1  設(shè)計(jì)向量檢索系統(tǒng):提升檢索效率 232
10.2.2  優(yōu)化索引結(jié)構(gòu):加速醫(yī)學(xué)文獻(xiàn)的精確匹配 235
10.3  生成模塊開發(fā)、集成和調(diào)優(yōu) 239
10.3.1  生成模型與檢索的集成:精準(zhǔn)回答用戶提問 239
10.3.2  生成內(nèi)容的優(yōu)化與提示詞調(diào)優(yōu):提升回答的質(zhì)量與專業(yè)性 241
10.4  本章小結(jié) 249
10.5  思考題 250
第 11 章  法律法規(guī)查詢助手的開發(fā) 251
11.1  需求分析與數(shù)據(jù)收集 251
11.1.1  用戶需求解析:明確法律法規(guī)查詢的主要需求 252
11.1.2  法律法規(guī)數(shù)據(jù)源與收集方法:搭建全面的法規(guī)數(shù)據(jù)庫 253
11.1.3  數(shù)據(jù)清洗與標(biāo)準(zhǔn)化:提升查詢效率和準(zhǔn)確性 253
11.2  法律法規(guī)檢索模塊的實(shí)現(xiàn) 257
11.2.1  向量化法律條款:構(gòu)建檢索友好的嵌入 257
11.2.2  FAISS索引在法規(guī)查詢中的應(yīng)用:提升檢索性能 259
11.2.3  優(yōu)化檢索流程:提高法律條款的匹配精度 261
11.3  生成模塊開發(fā)與輸出優(yōu)化 264
11.3.1  生成模型與檢索模塊的集成:構(gòu)建準(zhǔn)確的法規(guī)回答 265
11.3.2  輸出格式與內(nèi)容優(yōu)化:提供清晰的法律解釋 267
11.3.3  提示詞調(diào)優(yōu)與模型配置:確保法律回答的專業(yè)性 268
11.4  本章小結(jié) 273
11.5  思考題 273

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.stefanvlieger.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)