图文详情

LLaMA+ChatGLM大模型实战

正版全新

作者: 薛栋编著
出版社: 化学工业出版社
ISBN: 9787122499769
出版时间: 2022-12

装帧: 平装
开本: 16开
纸张: 胶版纸

作者: 薛栋编著
出版社: 化学工业出版社
ISBN: 9787122499769

出版时间: 2022-12
装帧: 平装

开本: 16开
纸张: 胶版纸

售价 69.60 7.0折

定价￥99.00

品相全新

优惠

发货

承诺48小时内发货

运费

本店暂时无法向该地区发货

延迟发货说明

时间：

说明：

上书时间2026-06-03

数量: 库存11件

立即购买加入购物车收藏

卖家超过10天未登录

五年老店

教育社科专营店

店铺等级

资质认证

90天平均

成功完成

72.73% (13笔)

好评率

100%

发货时间

11.16小时

店主

悦读识人

联系

在线交谈离线留言

地址

浙江省杭州市滨江区

进店逛逛收藏店铺

商品详情
店铺评价

立即购买加入购物车收藏

手机购买

微信扫码访问

商品分类：

计算机与互联网

货号：

5034548

商品描述：

【书    名】 LLaMA+ChatGLM大模型实战
【书    号】 9787122499769
【出版社】化学工业出版社
【作    者】薛栋编著
【出版日期】 2026-06-01
【开    本】 16开
【定    价】 99.00元

【内容简介】
本书循序渐进地讲解了LLaMA与ChatGLM在实际项目中的应用与开发技巧，内容全面，通俗易懂，兼具理论与实践价值。
  全书共11章，涵盖从模型基础到大规模应用的关键知识。主要内容包括LLaMA与ChatGLM的架构解析、模型训练与微调策略、模型高效部署与维护、多模态模型的集成与应用以及在自然语言处理、对话生成等领域的案例实战。本书通过详细的代码示例与实战项目，帮助读者从理论学习迈向实践开发。全书内容组织合理，注重读者的学习体验，既阐述了大模型的底层技术，也聚焦于实用性极强的项目案例。同时，书中介绍了业界前沿的模型训练技巧与性能优化方案，为从事大模型开发与研究的人员提供了宝贵的参考。
  本书适合对大模型开发、深度学习、人工智能技术感兴趣的技术人员与研究人员学习使用，同时也可作为高校相关专业师生的教学用书以及企业技术培训的教材。

【目录】
第1部分　基础知识    001

第1章　大语言模型基础    002

1.1　人工智能    003

1.1.1　人工智能的发展历程    003

1.1.2　人工智能的研究领域    004

1.1.3　人工智能对人们生活的影响    004

1.2　大语言模型介绍    005

1.2.1　大语言模型的定义与发展历程    005

1.2.2　大语言模型的核心功能与能力    005

1.2.3　大语言模型的典型应用场景    006

1.3　LLaMA与ChatGLM的基础知识    007

1.3.1　LLaMA介绍    007

1.3.2　ChatGLM介绍    008

1.3.3　LLaMA与ChatGLM的生态与技术支持    009

第2章　模型构建与训练基础    011

2.1　数据准备    012

2.1.1　分词    012

2.1.2　词干化    014

2.1.3　词形还原    015

2.1.4　去除停用词    016

2.1.5　数据清洗和处理    019

2.2　模型初始化    024

2.2.1　参数初始化    025

2.2.2　权重加载    025

2.3　常用的文本分类和情感分析模型    027

2.3.1　朴素贝叶斯分类器    027

2.3.2　支持向量机    028

2.3.3　随机森林    030

2.3.4　卷积神经网络（CNN）    031

2.3.5　循环神经网络（RNN）    033

2.4　优化器    036

2.4.1　优化器的基本概念    036

2.4.2　SGD与动量优化器    036

2.4.3　Adam优化器及其变体    039

2.4.4　自适应优化器    042

2.5　LLaMA与ChatGLM的训练架构共性分析    045

2.5.1　预训练的流程    045

2.5.2　微调策略：LoRA与其他高效参数化方法    045

2.5.3　模型并行与分布式训练    047

第3章　模型的部署与维护    049

3.1　大模型部署    050

3.1.1　部署前的准备工作    050

3.1.2　部署环境搭建与优化    051

3.2　大模型维护    052

3.2.1　模型监控与反馈机制    052

3.2.2　模型更新与迭代    053

3.3　推理优化    054

3.3.1　模型量化    054

3.3.2　模型剪枝    055

3.3.3　动态推理优化    056

3.4　交互接口开发：API与应用集成    057

3.4.1　模型API封装    057

3.4.2　前后端交互    059

3.5　大模型部署实战    060

第2部分　LLaMA深度解析    061

第4章　LLaMA的架构与技术分析    062

4.1　LLaMA的设计目标与演进历史    063

4.1.1　LLaMA的起源与研发背景    063

4.1.2　LLaMA的发展历程    064

4.2　获取LLaMA    064

4.2.1　从Meta官网获取模型并使用    064

4.2.2　从 Hugging Face获取模型并使用    065

4.3　模型结构    066

4.3.1　多层Transformer架构解析    066

4.3.2　高效注意力机制    068

4.4　LLaMA的基本操作    070

4.4.1　微调    070

4.4.2　量化    073

4.4.3　提示工程    074

4.4.4　模型验证    075

4.5　LLaMA的技术创新    076

4.5.1　推理优化    076

4.5.2　参数量控制策略：平衡性能与计算成本    083

4.6　LLaMA在多语言支持方面的技术解析    084

4.6.1　多语言支持的模型架构调整    084

4.6.2　数据集构建    087

4.6.3　LLaMA多语言推理性能分析与优化方向    089

第5章　LLaMA的开源生态与工具链    094

5.1　LLaMA社区与开源生态概述    095

5.1.1　LLaMA在开源社区中的定位与影响    095

5.1.2　主要贡献者与相关研究团队    095

5.1.3　开源生态的组成：模型、工具与资源    095

5.2　LLaMA的配套工具    095

5.2.1　LLaMA相关的数据集资源    095

5.2.2　常用训练框架    095

5.2.3　推理工具和插件    095

5.3　使用Hugging Face与LangChain集成LLaMA    095

5.3.1　Hugging Face模型库中的LLaMA支持    095

5.3.2　使用LangChain扩展LLaMA的任务能力    095

5.4　基于LLaMA 的多模式聊天机器人    095

5.4.1　商品销售聊天机器人    095

5.4.2　基于Flask的聊天机器人    095

5.4.3　基于RAG的聊天机器人    095

5.4.4　基于WhatsApp API的聊天机器人    095

第6章　基于LLaMA的实战应用    096

6.1　LLaMA微调实践    097

6.1.1　内置微调技术    097

6.1.2　LoRA微调    104

6.1.3　QLoRA微调    110

6.2　RAG操作实践    115

6.2.1　RAG介绍    115

6.2.2　LangChain介绍    116

6.2.3　基于RAG的法律法规解析系统    116

第3部分　ChatGLM深度解析    129

第7章　ChatGLM的架构与技术分析    130

7.1　ChatGLM的研发背景与项目初衷    131

7.2　获取和调用ChatGLM    131

7.2.1　通过智谱AI开放平台调用ChatGLM    132

7.2.2　从Hugging Face获取模型并使用    135

7.3　ChatGLM的特点    136

7.3.1　双语支持的技术实现    136

7.3.2　高效生成    137

7.3.3　面向对话的优化设计    140

7.4　推理优化    141

7.4.1　轻量化设计    141

7.4.2　低资源环境部署    142

7.4.3　推理加速工具：动态编译与张量优化方法    145

7.5　ChatGLM在中文语境下的优势    146

7.5.1　中文预训练数据的质量与覆盖范围    146

7.5.2　中文分词与语义理解的优化策略    147

7.5.3　在中文任务中的表现对比与优势分析    147

第8章　ChatGLM的开发工具与生态支持    149

8.1　开源社区与使用文档概览    150

8.1.1　ChatGLM的开源发布与社区影响    150

8.1.2　官方文档与使用指南的关键内容    150

8.2　模型训练与推理    150

8.2.1　数据预处理    150

8.2.2　分布式训练    150

8.2.3　高效微调    150

8.2.4　模型加速与优化    150

8.2.5　从开发环境到生产环境的迁移    150

8.3　常见问题与调优指南    150

8.3.1　ChatGLM在训练和推理中的常见问题排查    150

8.3.2　性能调优    150

8.3.3　改进生成质量与适应新任务    150

8.3.4　用户反馈与开发中的注意事项    150

8.4　LangChain对ChatGLM的支持    150

8.4.1　LangChain集成ChatGLM的技术方案    150

8.4.2　基于ChatGLM的简易诊断系统    150

第9章　基于ChatGLM的实战应用    151

9.1　ChatGLM微调实践    152

9.1.1　P-tuning V2微调    152

9.1.2　QLoRA微调    156

9.1.3　LoRA微调    166

9.2　基于ChatGLM3的聊天系统    179

9.2.1　下载大模型    179

9.2.2　数据处理    179

9.2.3　微调模型    184

9.2.4　模型推理    189

9.2.5　对话调用的准备工作    190

9.2.6　实现对话    202

第4部分　综合实战    205

第10章　基于本地知识库的自动问答系统（LangChain+ChatGLM+ModelScope/HuggingFace）    206

10.1　项目介绍    207

10.1.1　实现流程    207

10.1.2　核心技术栈    207

10.1.3　模块结构    208

10.2　具体实现    209

10.2.1　系统配置    209

10.2.2　文本拆分    210

10.2.3　加载和使用大语言模型    211

10.2.4　构建和部署对话系统    216

10.2.5　实现Web端的问答系统    223

10.3　基于ModelScope的ChatGLM对话系统    232

10.3.1　基于ChatGLM-6B的语言生成器    232

10.3.2　嵌入模型包装类    233

10.3.3　基于Gradio Web的问答系统    234

10.4　基于飞桨AI Studio的ChatGLM对话系统    239

10.4.1　基于PaddleNLP的聊天语言模型（LLM）    239

10.4.2　PaddleNLP嵌入包装    240

10.4.3　基于命令行的对话程序    241

10.4.4　基于Gradio Web的问答系统    243

第11章　多NLP模型训练和微调系统（LLaMA+Qwen+ChatGLM+Gradio）    247

11.1　项目介绍    248

11.2　数据集管理    248

11.2.1　数据集配置    248

11.2.2　监督微调数据集    250

11.2.3　获取BELLE多轮对话数据集    253

11.2.4　预训练数据集    254

11.3　模型处理    255

11.3.1　注意力机制配置    255

11.3.2　模型嵌入层的动态调整    257

11.3.3　梯度检查点优化    257

11.3.4　LLaMA的注意力机制实现    260

11.3.5　预训练模型处理    267

11.3.6　加载处理预训练模型    268

11.3.7　模型和分词器的补丁处理    271

11.3.8　模型微调    274

11.4　训练模型    277

11.4.1　PPO训练    278

11.4.2　DPO训练    288

11.4.3　模型定制    292

11.4.4　模型训练    294

11.4.5　监督微调    296

11.5　模型评估    300

11.5.1　评估模板    300

11.5.2　模型评估器    302

11.6　Web交互    304

11.6.1　模型管理引擎    304

11.6.2　Web接口    305

11.6.3　聊天界面    306

11.6.4　命令行操作接口    309

【前言】
人工智能（artificial intelligence, AI）作为21世纪*具变革性的技术之一，正在深刻影响着各行各业。从自动驾驶、医疗诊断到智能客服、语言翻译，AI技术不仅提高了生产效率，也改变了我们的生活方式。随着算法、算力和数据的不断进步，人工智能从单点应用逐步发展为多领域协同的智能生态系统。特别是在大模型的加持下，AI具有了更强的认知和生成能力，为自然语言处理、图像生成及多模态任务带来了突破性的进展。人工智能的迅猛发展不仅推动了技术创新，也为社会经济发展创造了前所未有的
机遇。
LLaMA和ChatGLM是近年来大模型领域的重要代表。LLaMA（Large Language Model Meta AI）由Meta推出，以高效训练和优秀性能著称，为自然语言处理和多语言任务提供了强大的支持。ChatGLM（Chat General Language Model）是清华大学推出的一款面向中文及其他语言的开源大模型，具备优秀的对话生成和语言理解能力，能够实现人性化的自然语言交互。两者的结合在文本生成、代码编写、语义理解及知识问答等领域表现出色，为研究人员和开发者提供了灵活高效的解决方案。通过深入理解和掌握LLaMA与ChatGLM的核心技术，开发者能够构建更智能、更高效的AI应用，实现真正的智能化交互体验。
本书的特色
本书通过理论与实践相结合的方式，全面、深入地讲解了LLaMA与ChatGLM的核心技术与应用方法。下面是本书的主要特色。
（1）循序渐进，内容结构清晰
从大模型的基础原理到复杂的多模态实战案例，本书内容层层递进，帮助读者在逐步掌握理论的同时积累实践经验。
（2）聚焦LLaMA与ChatGLM前沿技术
本书深入分析了LLaMA与ChatGLM的架构设计、优化策略及应用场景，展现了当前大模型技术的*新发展与*佳实践。
（3）丰富实战案例，全流程教学
涵盖文本生成、代码编写、对话系统等多种实际应用场景，提供完整的项目开发流程，从模型训练、微调到部署，帮助读者掌握全链路开发技能。
（4）性能优化与高效部署指导
重点介绍了大模型在资源受限环境中的性能调优方法，包括内存优化、训练加速和高效部署策略，助力企业和开发者实现高效模型应用。
（5）多模态创新应用探索
涵盖文本、图像、音视频等多模态任务，通过丰富的案例展示LLaMA与ChatGLM在多模态交互与生成领域的应用潜力，为读者提供创新应用的参考。
（6）适合不同层次的读者
语言通俗易懂，内容涵盖从基础到高级的知识，既适合AI领域的初学者，也能为研究人员和工程师提供参考与专业指导。
（7）前瞻性视角与产业化实践建议
本书不仅注重技术细节，还探讨了大模型技术的未来趋势与商业应用场景，为大模型技术的落地与创新应用提供了前瞻性思考。
本书在编写过程中，得到了化学工业出版社各位专业编辑的悉心指导与大力支持。正是他们的严谨、耐心和高效的态度，确保了本书能够顺利出版。对此，我深表感谢。
同时，我也衷心感谢家人在整个写作期间给予的巨大支持与理解。他们的陪伴与鼓励是我坚持完成本书的重要动力。
由于个人水平有限，书中难免存在不足之处，恳请广大读者不吝赐教，提出宝贵的意见与建议，以便后续版本不断完善与改进。

编著者
配送说明

...
相似商品
为你推荐

本店分类

孔网分类

图书

图书

LLaMA+ChatGLM大模型实战

孔网啦啦啦啦啦纺织女工火锅店第三课