成功加入购物车

去购物车结算 X
静语飞扬
  • 正版图书 大规模语言模型从理论到实践 9787121467059 电子工业出

正版图书 大规模语言模型从理论到实践 9787121467059 电子工业出

举报

正版图书 没有图片的请核对书号下单 以书名为准~ 出版时间系统采集的 请注意!

  • 作者: 
  • 出版社:    电子工业出版社
  • ISBN:    9787121467059
  • 出版时间: 
  • 版次:    1
  • 装帧:    平装
  • 开本:    16开
  • 纸张:    胶版纸
  • 出版时间: 
  • 版次:  1
  • 装帧:  平装
  • 开本:  16开
  • 纸张:  胶版纸

售价 72.58 6.7折

定价 ¥109.00 

品相 全新品相描述

优惠 满包邮

优惠 满减券
    运费
    本店暂时无法向该地区发货

    延迟发货说明

    时间:
    说明:

    上书时间2024-05-18

    数量
    库存369
    微信扫描下方二维码
    微信扫描打开成功后,点击右上角”...“进行转发

    卖家超过10天未登录

    十年老店
    店铺等级
    拍卖等级
    资质认证
    90天平均
    成功完成
    89.6% (3334笔)
    好评率
    99.68%
    发货时间
    27.22小时
    地址
    北京市朝阳区
    • 商品详情
    • 店铺评价
    立即购买 加入购物车 收藏
    手机购买
    微信扫码访问
    • 货号:
      wht- 9787121467059
      品相描述:全新
      库存书 未翻阅
      商品描述:
      基本信息
      书名:大规模语言模型从理论到实践
      定价:109元
      作者:未知
      出版社:电子工业出版社
      出版日期:2024-01-01
      ISBN:9787121467059
      字数:
      页码:
      版次:
      装帧:平装
      开本:16开
      商品重量:
      编辑推荐
      √解码大语言模型奥秘,机器智能新时代!√详细介绍构建LLM的四个主要阶段:预训练、有监督微调、奖励建模和强化学习。每个阶段都有算法、代码、数据来源、难点及实践经验的详细讨论。√结合作者在NLP领域多年的研究经验、超300篇相关论文深度研读感悟!√分享作者团队从0开始研发复旦大学MOSS大语言模型过程中的实践经验,为读者展示大语言模型训练的全流程细节。√配全书PPT课件。
      内容提要
      2023年ChatGPT火爆全球,以其为代表的人工智能大语言模型成为全球人工智能从业者关注的焦点。 本书详细介绍了构建大语言模型的四个主要阶段:预训练、有监督微调、奖励建模和强化学习。每个阶段都有算法、代码、数据、难点及实践经验的详细讨论。本书以大语言模型的基础理论开篇,探讨了大语言模型预训练数据的构建方法,以及大语言模型如何理解并服从人类指令,介绍了大语言模型的扩展应用和评估方法,为读者提供了更全面的视野。 本书旨在为对大语言模型感兴趣的读者提供入门指南,也可作为高年级本科生和研究生自然语言处理相关课程的补充教材。
      目录
      章 绪论 11.1 大语言模型的基本概念 11.2 大语言模型的发展历程 41.3 大语言模型的构建流程 81.4 本书的内容安排 11第2章 大语言模型基础 132.1 Transformer结构 132.1.1 嵌入表示层 142.1.2 注意力层 162.1.3 前馈层 182.1.4 残差连接与层归一化 192.1.5 编码器和解码器结构 202.2 生成式预训练语言模型GPT 252.2.1 无监督预训练 262.2.2 有监督下游任务微调 272.2.3 基于HuggingFace的预训练语言模型实践 272.3 大语言模型的结构 332.3.1 LLaMA的模型结构 342.3.2 注意力机制优化 402.4 实践思考 47第3章 大语言模型预训练数据 493.1 数据来源 493.1.1 通用数据 503.1.2 专业数据 513.2 数据处理 523.2.1 质量过滤 523.2.2 冗余去除 533.2.3 隐私消除 553.2.4 词元切分 553.3 数据影响分析 613.3.1 数据规模 613.3.2 数据质量 643.3.3 数据多样性 663.4 开源数据集 683.4.1 Pile 683.4.2 ROOTS 713.4.3 RefinedWeb 733.4.4 SlimPajama 753.5 实践思考 79第4章 分布式训练 804.1 分布式训练概述 804.2 分布式训练的并行策略 834.2.1 数据并行 844.2.2 模型并行 884.2.3 混合并行 964.2.4 计算设备内存优化 974.3 分布式训练的集群架构 1024.3.1 高性能计算集群的典型硬件组成 1024.3.2 参数服务器架构 1034.3.3 去中心化架构 1044.4 DeepSpeed实践 1104.4.1 基础概念 1124.4.2 LLaMA分布式训练实践 1154.5 实践思考 127第5章 有监督微调 1285.1 提示学习和语境学习 1285.1.1 提示学习 1285.1.2 语境学习 1305.2 高效模型微调 1315.2.1 LoRA 1315.2.2 LoRA的变体 1355.3 模型上下文窗口扩展 1375.3.1 具有外推能力的位置编码 1375.3.2 插值法 1385.4 指令数据的构建 1415.4.1 手动构建指令 1415.4.2 自动构建指令 1425.4.3 开源指令数据集 1465.5 DeepSpeed-Chat SFT实践 1475.5.1 代码结构 1485.5.2 数据预处理 1515.5.3 自定义模型 1535.5.4 模型训练 1555.5.5 模型推理 1565.6 实践思考 157第6章 强化学习 1586.1 基于人类反馈的强化学习 1586.1.1 强化学习概述 1596.1.2 强化学习与有监督学习的区别 1616.1.3 基于人类反馈的强化学习流程 1626.2 奖励模型 1636.2.1 数据收集 1646.2.2 模型训练 1666.2.3 开源数据 1676.3 近端策略优化 1686.3.1 策略梯度 1686.3.2 广义优势估计 1736.3.3 近端策略优化算法 1756.4 MOSS-RLHF实践 1806.4.1 奖励模型训练 1806.4.2 PPO微调 1816.5 实践思考 191第7章 大语言模型应用 1937.1 推理规划 1937.1.1 思维链提示 1937.1.2 由少至多提示 1967.2 综合应用框架 1977.2.1 LangChain框架核心模块 1987.2.2 知识库问答系统实践 2167.3 智能代理 2197.3.1 智能代理的组成 2197.3.2 智能代理的应用实例 2217.4 多模态大语言模型 2287.4.1 模型架构 2297.4.2 数据收集与训练策略 2327.4.3 多模态能力示例 2367.5 大语言模型推理优化 2387.5.1 FastServe框架 2417.5.2 vLLM推理框架实践 2427.6 实践思考 244第8章 大语言模型评估 2458.1 模型评估概述 2458.2 大语言模型评估体系 2478.2.1 知识与能力 2478.2.2 伦理与安全 2508.2.3 垂直领域评估 2558.3 大语言模型评估方法 2608.3.1 评估指标 2608.3.2 评估方法 2678.4 大语言模型评估实践 2748.4.1 基础模型评估 2748.4.2 SFT模型和RL模型评估 2778.5 实践思考 282参考文献 284索引 303
      作者介绍

      序言

      配送说明

      ...

      相似商品

      为你推荐

    孔网啦啦啦啦啦纺织女工火锅店第三课

    开播时间:09月02日 10:30

    即将开播,去预约
    直播中,去观看