暂无商品咨询信息 [发表商品咨询]
【实力推荐】国企技术专家、大厂AI研究员、知名开源项目作者及科技媒体号主联袂推荐,为初学者提供可靠学习指南。
【好读易学】内容清晰简明,逻辑层层递进,零基础也能轻松掌握RAG核心原理与实践技巧。
【完整实战】包含从零搭建RAG系统的全流程案例,配套完整源码,读完即可动手实现自己的项目。
本书全面解析了RAG 技术,涵盖从理论基础到实战应用的各个方面。书中首先对RAG 的背景、定义及与相关技术的关系进行了清晰阐述,然后深入剖析了RAG 的框架,并详细讲解了数据构建、数据检索及响应生成等关键环节。此外,本书还探讨了RAG 的评估与优化方法,以及该领域的前沿技术。最后通过项目实战案例,帮助读者将所学知识应用于实际项目,提升解决问题的能力。
张其来,高级算法工程师,拥有7年人工智能研发经验,先后就职于阿里、百度、滴滴、浪潮等互联网大厂,领导多项省部级大模型知识库研发项目。擅长写作,业余时间在公众号“芝士A吃鱼”分享大模型、RAG、Agent等知识。
徐思琪,天津大学硕士,高级研发工程师,深耕自然语言处理领域多年,持有多项发明专利并主导 10余个工业级项目落地。研究聚焦智能问答系统、舆情分析及知识图谱构建三大方向,擅长基于业务场景打造全链路解决方案。
第 1章 RAG概述 1
1.1 RAG的由来和定义 1
1.2 RAG的必要性 7
1.3 RAG和微调 11
1.3.1 技术对比与适用场景分析 11
1.3.2 应用场景分析与选择策略 14
1.3.3 RAG和微调的结合趋势 16
1.3.4 小结 17
1.4 RAG和长上下文 18
1.5 总结 20
第 2章 RAG框架详解 21
2.1 触发检索的判断策略 21
2.1.1 基于相关性的触发策略 22
2.1.2 基于问题类型的触发策略 25
2.1.3 基于交互历史的自适应触发 26
2.1.4 基于知识库状态的触发调整 27
2.2 大模型自身知识和检索知识的平衡 28
2.2.1 检索知识与大模型自身知识的冲突解决 28
2.2.2 检索知识与大模型自身知识的互补融合 29
2.2.3 小结 31
2.3 RAG常见范式 32
2.3.1 顺序式RAG 32
2.3.2 分支式RAG 34
2.3.3 循环式RAG 38
2.3.4 小结 42
2.4 总结 43
第3章 RAG数据构建 44
3.1 向量化技术概述 44
3.1.1 引言 44
3.1.2 向量化技术在RAG中的作用 46
3.1.3 RAG任务对向量模型的特殊需求 49
3.1.4 向量模型的评估与选择 51
3.1.5 小结 54
3.2 向量数据库:数据管理的新范式 54
3.2.1 引言 54
3.2.2 什么是向量数据库 55
3.2.3 向量数据库与传统数据库的对比 56
3.2.4 向量索引技术 57
3.2.5 向量数据库的选择 59
3.2.6 小结 61
3.3 RAG数据解析 62
3.3.1 多源异构数据的挑战与难点 62
3.3.2 RAG系统的数据整合与处理 63
3.3.3 案例分析:利用LangChain 处理多源异构数据 65
3.3.4 小结 68
3.4 RAG数据处理 68
3.4.1 文本分割 68
3.4.2 数据组织 73
3.4.3 基于 DeepSeek 和 Ollama 的代码实践 76
3.4.4 小结 80
3.5 总结 80
第4章 RAG数据检索 82
4.1 用户查询理解 82
4.1.1 查询的特点与挑战 82
4.1.2 查询理解技术 83
4.1.3 小结 88
4.2 基础检索范式 89
4.2.1 语义向量检索 89
4.2.2 关键词检索 93
4.2.3 混合检索 94
4.2.4 小结 96
4.3 从基础到高级:多元化的检索范式 97
4.3.1 细化的检索逻辑 97
4.3.2 生成假设性答案 102
4.3.3 迭代式检索 102
4.3.4 分步提示 103
4.3.5 基于表示模型的检索 105
4.3.6 重写-检索-阅读 111
4.3.7 基于知识库的语义增强 113
4.3.8 小结 113
4.4 重排模块 114
4.4.1 重排模块的必要性 114
4.4.2 重排模块的方法 116
4.4.3 重排模块的选择和效果评估 121
4.4.4 小结 123
4.5 RAG上下文压缩技术 124
4.5.1 上下文压缩的目的 124
4.5.2 上下文压缩的策略 125
4.5.3 小结 127
4.6 总结 128
第5章 RAG响应生成 129
5.1 提示工程在RAG中的应用 129
5.1.1 提示工程基本概念介绍 129
5.1.2 提示的类型与应用 130
5.1.3 RAG中常见的高级技巧 132
5.1.4 RAG中的提示工程实践 136
5.1.5 提示的优化策略 141
5.1.6 小结 143
5.2 RAG中的监督微调技术 143
5.2.1 监督微调的必要性和应用价值 144
5.2.2 面向检索结果的RAG微调 144
5.2.3 面向下游任务的RAG微调 148
5.2.4 小结 151
5.3 其他RAG技术的探索 151
5.3.1 大模型的选择与优化 151
5.3.2 RAG中的解码策略 153
5.3.3 融合外部知识增强RAG生成 155
5.3.4 RAG的多模态扩展 156
5.3.5 RAG的主动问答与交互能力 163
5.4 RAG的安全性与伦理性思考 165
5.5 总结 168
第6章 RAG的评估和优化 169
6.1 RAG的评估 169
6.1.1 评估指标 169
6.1.2 评估方法 172
6.1.3 评估基准 175
6.1.4 小结 179
6.2 RAG落地常见问题和优化方案 180
6.2.1 数据问题 180
6.2.2 检索问题 182
6.2.3 生成问题 184
6.2.4 其他开放性问题 188
6.2.5 小结 191
6.3 前沿RAG方法 191
6.3.1 动态相关RAG 191
6.3.2 Graph RAG 192
6.3.3 FlashRAG 193
6.3.4 DocReLM 195
6.3.5 小结 196
6.4 总结 197
第7章 项目实战 198
7.1 搭建基础RAG系统 198
7.1.1 代码实战 198
7.1.2 小结 203
7.2 优化RAG检索模块 204
7.2.1 实现多种检索策略 204
7.2.2 比较不同检索策略的性能 206
7.2.3 小结 208
7.3 增强RAG生成模块 208
7.3.1 代码实战 209
7.3.2 小结 214
7.4 RAG与知识图谱的结合实践 214
7.4.1 代码实战 214
7.4.2 小结 226
7.5 多模态RAG 227
7.5.1 代码实战 227
7.5.2 多模态RAG的优势和局限性 231
7.5.3 优化和扩展建议 232
7.5.4 小结 233
7.6 RAG系统优化与调试 233
7.6.1 性能优化 233
7.6.2 检索结果质量提升 238
7.6.3 系统调试 239
7.6.4 持续优化策略 242
7.6.5 小结 243
7.7 构建端到端的RAG应用 243
7.7.1 代码实战 243
7.7.2 小结 250
7.8 RAG系统的测试与评估 250
7.8.1 代码实战 250
7.8.2 小结 257
7.9 总结 257
基本信息 | |
---|---|
出版社 | 人民邮电出版社 |
ISBN | 9787115668981 |
条码 | 9787115668981 |
编者 | 张其来 著 |
译者 | -- |
出版年月 | 2025-05-01 00:00:00.0 |
开本 | 32开 |
装帧 | 平装 |
页数 | 258 |
字数 | |
版次 | 1 |
印次 | 1 |
纸张 |
暂无商品评论信息 [发表商品评论]
暂无商品咨询信息 [发表商品咨询]