正版全新
-
作者:
薛栋 编著
-
出版社:
化学工业出版社
-
ISBN:
9787122499769
-
出版时间:
2022-12
-
作者:
薛栋 编著
-
出版社:
化学工业出版社
-
ISBN:
9787122499769
售价
¥
69.60
7.0折
定价
¥99.00
品相
全新
上书时间2026-06-03
卖家超过10天未登录
-
-
商品描述:
-
【书 名】 LLaMA+ChatGLM大模型实战
【书 号】 9787122499769
【出 版 社】 化学工业出版社
【作 者】 薛栋 编著
【出版日期】 2026-06-01
【开 本】 16开
【定 价】 99.00元
【内容简介】
本书循序渐进地讲解了LLaMA与ChatGLM在实际项目中的应用与开发技巧,内容全面,通俗易懂,兼具理论与实践价值。
全书共11章,涵盖从模型基础到大规模应用的关键知识。主要内容包括LLaMA与ChatGLM的架构解析、模型训练与微调策略、模型高效部署与维护、多模态模型的集成与应用以及在自然语言处理、对话生成等领域的案例实战。本书通过详细的代码示例与实战项目,帮助读者从理论学习迈向实践开发。全书内容组织合理,注重读者的学习体验,既阐述了大模型的底层技术,也聚焦于实用性极强的项目案例。同时,书中介绍了业界前沿的模型训练技巧与性能优化方案,为从事大模型开发与研究的人员提供了宝贵的参考。
本书适合对大模型开发、深度学习、人工智能技术感兴趣的技术人员与研究人员学习使用,同时也可作为高校相关专业师生的教学用书以及企业技术培训的教材。
【目录】
第1部分 基础知识 001
第1章 大语言模型基础 002
1.1 人工智能 003
1.1.1 人工智能的发展历程 003
1.1.2 人工智能的研究领域 004
1.1.3 人工智能对人们生活的影响 004
1.2 大语言模型介绍 005
1.2.1 大语言模型的定义与发展历程 005
1.2.2 大语言模型的核心功能与能力 005
1.2.3 大语言模型的典型应用场景 006
1.3 LLaMA与ChatGLM的基础知识 007
1.3.1 LLaMA介绍 007
1.3.2 ChatGLM介绍 008
1.3.3 LLaMA与ChatGLM的生态与技术支持 009
第2章 模型构建与训练基础 011
2.1 数据准备 012
2.1.1 分词 012
2.1.2 词干化 014
2.1.3 词形还原 015
2.1.4 去除停用词 016
2.1.5 数据清洗和处理 019
2.2 模型初始化 024
2.2.1 参数初始化 025
2.2.2 权重加载 025
2.3 常用的文本分类和情感分析模型 027
2.3.1 朴素贝叶斯分类器 027
2.3.2 支持向量机 028
2.3.3 随机森林 030
2.3.4 卷积神经网络(CNN) 031
2.3.5 循环神经网络(RNN) 033
2.4 优化器 036
2.4.1 优化器的基本概念 036
2.4.2 SGD与动量优化器 036
2.4.3 Adam优化器及其变体 039
2.4.4 自适应优化器 042
2.5 LLaMA与ChatGLM的训练架构共性分析 045
2.5.1 预训练的流程 045
2.5.2 微调策略:LoRA与其他高效参数化方法 045
2.5.3 模型并行与分布式训练 047
第3章 模型的部署与维护 049
3.1 大模型部署 050
3.1.1 部署前的准备工作 050
3.1.2 部署环境搭建与优化 051
3.2 大模型维护 052
3.2.1 模型监控与反馈机制 052
3.2.2 模型更新与迭代 053
3.3 推理优化 054
3.3.1 模型量化 054
3.3.2 模型剪枝 055
3.3.3 动态推理优化 056
3.4 交互接口开发:API与应用集成 057
3.4.1 模型API封装 057
3.4.2 前后端交互 059
3.5 大模型部署实战 060
第2部分 LLaMA深度解析 061
第4章 LLaMA的架构与技术分析 062
4.1 LLaMA的设计目标与演进历史 063
4.1.1 LLaMA的起源与研发背景 063
4.1.2 LLaMA的发展历程 064
4.2 获取LLaMA 064
4.2.1 从Meta官网获取模型并使用 064
4.2.2 从 Hugging Face获取模型并使用 065
4.3 模型结构 066
4.3.1 多层Transformer架构解析 066
4.3.2 高效注意力机制 068
4.4 LLaMA的基本操作 070
4.4.1 微调 070
4.4.2 量化 073
4.4.3 提示工程 074
4.4.4 模型验证 075
4.5 LLaMA的技术创新 076
4.5.1 推理优化 076
4.5.2 参数量控制策略:平衡性能与计算成本 083
4.6 LLaMA在多语言支持方面的技术解析 084
4.6.1 多语言支持的模型架构调整 084
4.6.2 数据集构建 087
4.6.3 LLaMA多语言推理性能分析与优化方向 089
第5章 LLaMA的开源生态与工具链 094
5.1 LLaMA社区与开源生态概述 095
5.1.1 LLaMA在开源社区中的定位与影响 095
5.1.2 主要贡献者与相关研究团队 095
5.1.3 开源生态的组成:模型、工具与资源 095
5.2 LLaMA的配套工具 095
5.2.1 LLaMA相关的数据集资源 095
5.2.2 常用训练框架 095
5.2.3 推理工具和插件 095
5.3 使用Hugging Face与LangChain集成LLaMA 095
5.3.1 Hugging Face模型库中的LLaMA支持 095
5.3.2 使用LangChain扩展LLaMA的任务能力 095
5.4 基于LLaMA 的多模式聊天机器人 095
5.4.1 商品销售聊天机器人 095
5.4.2 基于Flask的聊天机器人 095
5.4.3 基于RAG的聊天机器人 095
5.4.4 基于WhatsApp API的聊天机器人 095
第6章 基于LLaMA的实战应用 096
6.1 LLaMA微调实践 097
6.1.1 内置微调技术 097
6.1.2 LoRA微调 104
6.1.3 QLoRA微调 110
6.2 RAG操作实践 115
6.2.1 RAG介绍 115
6.2.2 LangChain介绍 116
6.2.3 基于RAG的法律法规解析系统 116
第3部分 ChatGLM深度解析 129
第7章 ChatGLM的架构与技术分析 130
7.1 ChatGLM的研发背景与项目初衷 131
7.2 获取和调用ChatGLM 131
7.2.1 通过智谱AI开放平台调用ChatGLM 132
7.2.2 从Hugging Face获取模型并使用 135
7.3 ChatGLM的特点 136
7.3.1 双语支持的技术实现 136
7.3.2 高效生成 137
7.3.3 面向对话的优化设计 140
7.4 推理优化 141
7.4.1 轻量化设计 141
7.4.2 低资源环境部署 142
7.4.3 推理加速工具:动态编译与张量优化方法 145
7.5 ChatGLM在中文语境下的优势 146
7.5.1 中文预训练数据的质量与覆盖范围 146
7.5.2 中文分词与语义理解的优化策略 147
7.5.3 在中文任务中的表现对比与优势分析 147
第8章 ChatGLM的开发工具与生态支持 149
8.1 开源社区与使用文档概览 150
8.1.1 ChatGLM的开源发布与社区影响 150
8.1.2 官方文档与使用指南的关键内容 150
8.2 模型训练与推理 150
8.2.1 数据预处理 150
8.2.2 分布式训练 150
8.2.3 高效微调 150
8.2.4 模型加速与优化 150
8.2.5 从开发环境到生产环境的迁移 150
8.3 常见问题与调优指南 150
8.3.1 ChatGLM在训练和推理中的常见问题排查 150
8.3.2 性能调优 150
8.3.3 改进生成质量与适应新任务 150
8.3.4 用户反馈与开发中的注意事项 150
8.4 LangChain对ChatGLM的支持 150
8.4.1 LangChain集成ChatGLM的技术方案 150
8.4.2 基于ChatGLM的简易诊断系统 150
第9章 基于ChatGLM的实战应用 151
9.1 ChatGLM微调实践 152
9.1.1 P-tuning V2微调 152
9.1.2 QLoRA微调 156
9.1.3 LoRA微调 166
9.2 基于ChatGLM3的聊天系统 179
9.2.1 下载大模型 179
9.2.2 数据处理 179
9.2.3 微调模型 184
9.2.4 模型推理 189
9.2.5 对话调用的准备工作 190
9.2.6 实现对话 202
第4部分 综合实战 205
第10章 基于本地知识库的自动问答系统(LangChain+ChatGLM+ModelScope/HuggingFace) 206
10.1 项目介绍 207
10.1.1 实现流程 207
10.1.2 核心技术栈 207
10.1.3 模块结构 208
10.2 具体实现 209
10.2.1 系统配置 209
10.2.2 文本拆分 210
10.2.3 加载和使用大语言模型 211
10.2.4 构建和部署对话系统 216
10.2.5 实现Web端的问答系统 223
10.3 基于ModelScope的ChatGLM对话系统 232
10.3.1 基于ChatGLM-6B的语言生成器 232
10.3.2 嵌入模型包装类 233
10.3.3 基于Gradio Web的问答系统 234
10.4 基于飞桨AI Studio的ChatGLM对话系统 239
10.4.1 基于PaddleNLP的聊天语言模型(LLM) 239
10.4.2 PaddleNLP嵌入包装 240
10.4.3 基于命令行的对话程序 241
10.4.4 基于Gradio Web的问答系统 243
第11章 多NLP模型训练和微调系统(LLaMA+Qwen+ChatGLM+Gradio) 247
11.1 项目介绍 248
11.2 数据集管理 248
11.2.1 数据集配置 248
11.2.2 监督微调数据集 250
11.2.3 获取BELLE多轮对话数据集 253
11.2.4 预训练数据集 254
11.3 模型处理 255
11.3.1 注意力机制配置 255
11.3.2 模型嵌入层的动态调整 257
11.3.3 梯度检查点优化 257
11.3.4 LLaMA的注意力机制实现 260
11.3.5 预训练模型处理 267
11.3.6 加载处理预训练模型 268
11.3.7 模型和分词器的补丁处理 271
11.3.8 模型微调 274
11.4 训练模型 277
11.4.1 PPO训练 278
11.4.2 DPO训练 288
11.4.3 模型定制 292
11.4.4 模型训练 294
11.4.5 监督微调 296
11.5 模型评估 300
11.5.1 评估模板 300
11.5.2 模型评估器 302
11.6 Web交互 304
11.6.1 模型管理引擎 304
11.6.2 Web接口 305
11.6.3 聊天界面 306
11.6.4 命令行操作接口 309
【前言】
人工智能(artificial intelligence, AI)作为21世纪*具变革性的技术之一,正在深刻影响着各行各业。从自动驾驶、医疗诊断到智能客服、语言翻译,AI技术不仅提高了生产效率,也改变了我们的生活方式。随着算法、算力和数据的不断进步,人工智能从单点应用逐步发展为多领域协同的智能生态系统。特别是在大模型的加持下,AI具有了更强的认知和生成能力,为自然语言处理、图像生成及多模态任务带来了突破性的进展。人工智能的迅猛发展不仅推动了技术创新,也为社会经济发展创造了前所未有的
机遇。
LLaMA和ChatGLM是近年来大模型领域的重要代表。LLaMA(Large Language Model Meta AI)由Meta推出,以高效训练和优秀性能著称,为自然语言处理和多语言任务提供了强大的支持。ChatGLM(Chat General Language Model)是清华大学推出的一款面向中文及其他语言的开源大模型,具备优秀的对话生成和语言理解能力,能够实现人性化的自然语言交互。两者的结合在文本生成、代码编写、语义理解及知识问答等领域表现出色,为研究人员和开发者提供了灵活高效的解决方案。通过深入理解和掌握LLaMA与ChatGLM的核心技术,开发者能够构建更智能、更高效的AI应用,实现真正的智能化交互体验。
本书的特色
本书通过理论与实践相结合的方式,全面、深入地讲解了LLaMA与ChatGLM的核心技术与应用方法。下面是本书的主要特色。
(1)循序渐进,内容结构清晰
从大模型的基础原理到复杂的多模态实战案例,本书内容层层递进,帮助读者在逐步掌握理论的同时积累实践经验。
(2)聚焦LLaMA与ChatGLM前沿技术
本书深入分析了LLaMA与ChatGLM的架构设计、优化策略及应用场景,展现了当前大模型技术的*新发展与*佳实践。
(3)丰富实战案例,全流程教学
涵盖文本生成、代码编写、对话系统等多种实际应用场景,提供完整的项目开发流程,从模型训练、微调到部署,帮助读者掌握全链路开发技能。
(4)性能优化与高效部署指导
重点介绍了大模型在资源受限环境中的性能调优方法,包括内存优化、训练加速和高效部署策略,助力企业和开发者实现高效模型应用。
(5)多模态创新应用探索
涵盖文本、图像、音视频等多模态任务,通过丰富的案例展示LLaMA与ChatGLM在多模态交互与生成领域的应用潜力,为读者提供创新应用的参考。
(6)适合不同层次的读者
语言通俗易懂,内容涵盖从基础到高级的知识,既适合AI领域的初学者,也能为研究人员和工程师提供参考与专业指导。
(7)前瞻性视角与产业化实践建议
本书不仅注重技术细节,还探讨了大模型技术的未来趋势与商业应用场景,为大模型技术的落地与创新应用提供了前瞻性思考。
本书在编写过程中,得到了化学工业出版社各位专业编辑的悉心指导与大力支持。正是他们的严谨、耐心和高效的态度,确保了本书能够顺利出版。对此,我深表感谢。
同时,我也衷心感谢家人在整个写作期间给予的巨大支持与理解。他们的陪伴与鼓励是我坚持完成本书的重要动力。
由于个人水平有限,书中难免存在不足之处,恳请广大读者不吝赐教,提出宝贵的意见与建议,以便后续版本不断完善与改进。
编著者
孔网啦啦啦啦啦纺织女工火锅店第三课
开播时间:09月02日 10:30
即将开播,去预约

直播中,去观看