计算机视觉与PyTorch项目实战 基于深度学习框架的端到端产品级模型设计与开发
举报
全新正版 极速发货
-
作者:
(印)阿克谢·库尔卡尼,(印)阿达沙·希瓦南达,(印)尼廷·奈杰·夏尔马
-
出版社:
清华大学出版社
-
ISBN:
9787302657422
-
出版时间:
2024-04
-
装帧:
平装
-
开本:
16开
-
作者:
(印)阿克谢·库尔卡尼,(印)阿达沙·希瓦南达,(印)尼廷·奈杰·夏尔马
-
出版社:
清华大学出版社
-
ISBN:
9787302657422
-
出版时间:
2024-04
售价
¥
65.16
6.6折
定价
¥99.00
品相
全新
上书时间2024-09-05
卖家超过10天未登录
-
-
商品描述:
-
目录
第1章 计算机视觉的基本构成 001
1.1 什么是计算机视觉 002
1.1.1 应用 002
1.1.2 通道 005
1.1.3 卷积神经网络 007
1.1.4 了解CNN架构类型 014
1.1.5 掌握深度学习模型 021
1.1.6 PyTorch简介 024
1.2 小结 026
第2章 图像分类 027
2.1 本章所涵盖的主题 028
2.2 方法概述 028
2.3 创建图像分类流程 029
2.3.1 第一个基本模型 030
2.3.2 数据 030
2.3.3 数据探索 032
2.3.4 数据加载器 033
2.3.5 定义模型 035
2.3.6 训练过程 040
2.3.7 基本模型的第二种变体 044
2.3.8 基本模型的第三种变体 046
2.3.9 基本模型的第四种变体 052
2.7 小结 053
第3章 构建目标检测模型 055
3.1 使用Boosted Cascade进行目标检测 056
3.2 R-CNN 058
3.2.1 区域候选网络 059
3.2.2 快速区域卷积神经网络 062
3.2.3 候选区域网络的工作原理 063
3.2.4 锚框生成层 064
3.2.5 候选区域层 065
3.3 Mask R-CNN 065
3.4 YOLO 066
3.5 YOLO V2/V3 068
3.6 项目代码片段 069
3.7 小结 082
第4章 构建图像分割模型 083
4.1 图像分割 084
4.2 PyTorch预训练支持 086
4.2.1 语义分割 086
4.2.2 实例分割 089
4.3 模型优化 090
4.4 小结 106
第5章 基于图的搜索和推荐系统 107
5.1 问题陈述 107
5.2 方法和方法论 108
5.3 实现 109
5.3.1 数据集 109
5.3.2 安装和导入库 110
5.3.3 导入和理解数据 111
5.3.4 特征工程 114
5.3.5 计算相似度和排名 121
5.3.6 可视化推荐结果 122
5.3.7 从用户处接收图输入并推荐相似产品 125
5.4 小结 128
第6章 姿态估计 129
6.1 自顶向下的方法 130
6.2 自底向上的方法 130
6.3 OpenPose 131
6.3.1 分支1 131
6.3.2 分支2 131
6.4 HRNet 133
6.5 Higher HRNet 135
6.6 PoseNet 136
6.6.1 PoseNet工作机制 136
6.6.2 PoseNet的优点和缺点 140
6.6.3 姿态估计的应用 140
6.6.4 在杂货店视频上进行的测试用例 140
6.7 实现 141
6.8 小结 148
第7章 图像异常检测 149
7.1 异常检测 149
7.2 方法1:使用预训练的分类模型 151
7.3 方法2:使用自编码器 165
7.4 小结 168
第8章 图像超分辨率 169
8.1 利用最近邻概念放大图像 170
8.2 理解双线性插值 171
8.3 变分自编码器 172
8.4 生成式对抗网络 176
8.5 模型代码 177
8.6 模型开发 177
8.7 运行应用程序 188
8.8 小结 190
第9章 视频分析 191
9.1 问题陈述 192
9.2 方法 194
9.3 实现 195
9.3.1 数据 196
9.3.2 把视频上传到Google Colab 197
9.3.3 将视频转换为一系列图像 197
9.3.4 图像提取 198
9.3.5 数据预处理 198
9.3.6 确定杂货店中的热点 200
9.3.7 导入图像 203
9.3.8 获取人群计数 203
9.3.9 安保与监控 205
9.3.10 确定人口统计学特征(年龄和性别) 208
9.4 小结 210
第10章 计算机视觉的可解释AI 211
10.1 Grad-CAM 212
10.2 Grad-CAM++ 213
10.3 NBDT 214
10.4 Grad-CAM和Grad-CAM++的实现 216
10.4.1 在单个图像上的Grad-CAM和Grad-CAM++实现 216
10.4.2 在单个图像上的NBDT实现 219
10.5 小结 221
内容摘要
本书使用PyTorch框架来讨论计算机视觉算法及其应用。首先介绍计算机视觉基础,主题涉及卷积神经网络、ResNet、YOLO、数据增强和业内使用的其他常规技术。随后简要概述PyTorch库。接下来探究图像分类问题、对象检测技术以及如何在训练和运行推理的同时实现迁移学习。最后通过一个完整的建模过程来阐述深度学习框架PyTorch是如何运用优化技巧和模型AI可解释性的。
本书适合具有一定基础的中高级读者阅读和参考,可以帮助他们使用迁移学习和PyTorch来搭建产品级的计算机视觉模型。
孔网啦啦啦啦啦纺织女工火锅店第三课
开播时间:09月02日 10:30
即将开播,去预约

直播中,去观看