成功加入购物车

去购物车结算 X
朗朗图书书店
  • 【全新正版】大数据、数据挖掘理论与应用实践
  • 【全新正版】大数据、数据挖掘理论与应用实践
图文详情
  • 【全新正版】大数据、数据挖掘理论与应用实践
  • 【全新正版】大数据、数据挖掘理论与应用实践

【全新正版】大数据、数据挖掘理论与应用实践

举报

全新正版书籍,假一罚四,放心选购。可开发票,24小时内发货。

  • 作者: 
  • 出版社:    北京大学
  • ISBN:    9787301318997
  • 出版时间: 
  • 装帧:    平装
  • 开本:    16开
  • 作者: 
  • 出版社:  北京大学
  • ISBN:  9787301318997
  • 出版时间: 
  • 装帧:  平装
  • 开本:  16开

售价 54.90 8.0折

定价 ¥69.00 

品相 全新

优惠 满包邮

优惠 满减券
    发货
    承诺48小时内发货
    运费
    本店暂时无法向该地区发货

    延迟发货说明

    时间:
    说明:

    上书时间2025-04-02

    数量
    库存2
    微信扫描下方二维码
    微信扫描打开成功后,点击右上角”...“进行转发

    卖家超过10天未登录

    店铺等级
    资质认证
    90天平均
    成功完成
    90.88% (361笔)
    好评率
    100%
    发货时间
    8.6小时
    地址
    浙江省嘉兴市海宁市
    电话
    • 商品详情
    • 店铺评价
    立即购买 加入购物车 收藏
    手机购买
    微信扫码访问
    • 货号:
      31126415
      商品描述:
      作者简介
      1.李文书,教授,工学博士,现任浙江理工大学信息学院,智能检测与系统实验室主任,硕士生导师。IEEE(1-1163129461)、中国计算机学会(E200016385M)会员和杭州市计算机学会会员。2.吴奇石,工学博士,西北大学国家级特聘教授,郑州大学讲座教授,西安电子科技大学华山学者,天津大学客座教授。3.蔡霞,女,计算机科学与技术硕士,浙江理工大学信息学院讲师,主要研究方向为数据挖掘、机器学习,获得CIIT大数据开发工程师证书。4.李杨,男,工学博士,现任浙江理工大学信息学院讲师,中国生物医学工程学会会员,主要研究方向为医学图像分析、机器学习,发表SCI/EI论文10余篇,申请发明专利3项。5.黄海,男,工学博士,现任浙江理工大学信息学院计算机系副教授,硕士生导师,主要研究方向为信息安全与密码学、大数据安全以及云计算安全等。6.苏先创,男,工学博士,现任浙江理工大学信息学院讲师,主要研究方向为机器学习、仿生智能系统,发表SCI/EI论文10余篇,获授权专利3项。

      目录
      第1章 绪论3
      1.1 什么是大数据4
      1.1.1 大数据的来源4
      1.1.2 大数据的表现形式5
      1.1.3 大数据的特征7
      1.2 什么是商业智能8
      1.3 大数据生命周期9
      1.4 数据科学研究的主要问题11
      1.5 数据科学的模型方法14
      1.5.1 有监督学习14
      1.5.2 无监督学习15
      1.5.3 半监督学习15
      1.6 大数据方向16
      1.6.1 大数据架构方向16
      1.6.2 大数据分析方向16
      1.6.3 大数据开发方向17
      第2章 数据预处理19
      2.1 统计分析20
      2.1.1 统计描述21
      2.1.2 统计分析中的基本概念25
      2.1.3 参数估计和假设检验27
      2.1.4 区间估计和检验28
      2.1.5 方差分析31
      2.2 数据预处理41
      2.2.1 数据清洗42
      2.2.2 数据集成45
      2.2.3 数据变换46
      2.2.4 数据归约47
      第3章 大数据可视化63
      3.1 数据可视化的发展历程64
      3.1.1 萌芽时期66
      3.1.2 拉开帷幕68
      3.1.3 初露锋芒69
      3.1.4 黄金时代70
      3.1.5 稳步发展72
      3.1.6 日新月异73
      3.2 数据可视化的分类74
      3.2.1 依据数据类型分类74
      3.2.2 依据展示方式分类77
      3.2.3 依据应用场景分类77
      3.3 数据可视化设计的原则78
      3.3.1 亲密性(分组)78
      3.3.2 对齐78
      3.3.3 重复/统一79
      3.3.4 对比/强调79
      3.3.5 力求表达准确、到位、简洁、易懂80
      3.4 数据可视化的流程80
      3.4.1 了解需求80
      3.4.2 可视化设计82
      3.5 应用实践82
      3.5.1 折线图83
      3.5.2 散点图84
      3.5.3 柱状图85
      3.5.4 词云图86
      3.5.5 雷达图88
      第4章 大数据安全91
      4.1 大数据安全概述92
      4.1.1 保密性92
      4.1.2 完整性93
      4.1.3 可用性93
      4.2 基本的密码技术93
      4.2.1 加密技术93
      4.2.2 数字签名技术94
      4.2.3 Hash函数和MAC算法95
      4.3 全同态加密技术95
      4.3.1 基本定义95
      4.3.2 全同态加密技术原理96
      4.3.3 全同态加密技术的应用98
      4.4 安全多方计算100
      4.4.1 基本定义100
      4.4.2 安全多方计算原理100
      4.4.3 安全多方计算的应用102
      4.5 差分隐私103
      4.5.1 基本定义104
      4.5.2 差分隐私原理105
      4.5.3 差分隐私的应用107
      4.6 区块链109
      4.6.1 基本定义110
      4.6.2 区块链技术原理111
      4.6.3 区块链技术的应用112
      第5章 线性回归分析119
      5.1 一元线性回归120
      5.1.1 一元线性回归概述120
      5.1.2 一元线性回归的参数估计123
      5.1.3 一元线性回归模型的检验125
      5.1.4 一元线性回归的预测127
      5.2 多元线性回归分析128
      5.2.1 多元线性回归模型及假定129
      5.2.2 参数估计129
      5.2.3 模型检验130
      5.2.4 预测131
      5.3 应用实践133
      5.3.1 基于Lasso回归的波士顿房价预测133
      5.3.2 基于线性回归的降雨量预测136
      第6章 聚类分析142
      6.1 聚类概述143
      6.2 几种常用的度量方法143
      6.2.1 欧几里得距离(Euclidean distance)144
      6.2.2 曼哈顿距离(Manhattan distance)144
      6.2.3 切比雪夫距离(Chebyshev distance)145
      6.2.4 幂距离(Power distance)145
      6.2.5 马氏距离(Mahalanobis distance)146
      6.2.6 余弦相似度(Cosine similarity)148
      6.2.7 Pearson相关系数(Pearson correlation coefficient)148
      6.2.8 Jaccard相似系数(Jaccard similarity coefficient)148
      6.3 聚类的方法150
      6.3.1 层次聚类150
      6.3.2 密度聚类151
      6.3.3 分割聚类152
      6.4 应用实践154
      6.4.1 基于DBSCAN密度聚类的鸢尾花品种分类154
      6.4.2 基于聚类和可视化的世界国家幸福指数分析157
      第7章 关联规则分析164
      7.1 关联规则分析概述165
      7.2 关联规则分析常用的基本概念166
      7.3 基于Apriori算法的关联规则分析168
      7.3.1 连接(linking)步骤168
      7.3.2 剪枝(pruning)步骤169
      7.3.3 Apriori算法处理流程169
      7.3.4 Apriori算法实例170
      7.3.5 由频繁项集生成关联规则172
      7.4 改进的Apriori算法172
      7.4.1 基于划分的方法172
      7.4.2 基于抽样的方法173
      7.4.3 增量更新的方法173
      7.4.4 概念层次的方法174
      7.4.5 基于散列和压缩技术的方法174
      7.5 基于FP-Growth算法的关联规则分析175
      7.6 多维和多层关联规则177
      7.6.1 多维关联规则挖掘177
      7.6.2 多层关联规则挖掘178
      7.7 应用实践179
      7.7.1 基于Apriori算法的用户购物关联度分析179
      7.7.2 基于FP-Growth算法的用户购物关联度分析183
      第8章 分类与预测195
      8.1 分类问题评价准则196
      8.2 线性分类198
      8.2.1 Logistic模型199
      8.2.2 判别分析202
      8.3 决策树206
      8.3.1 决策树的概念及基本算法206
      8.3.2 基于信息熵的决策树归纳算法208
      8.3.3 决策树修剪212
      8.3.4 提取决策规则212
      8.3.5 决策树的改进213
      8.4 AdaBoost算法215
      8.5 随机森林算法217
      8.5.1 设计随机森林分类器217
      8.5.2 构建随机森林218
      8.6 应用实践223
      8.6.1 基于随机森林算法预测是否被录取223
      8.6.2 基于决策树算法预测是否被录取227
      第9章 时间序列分析231
      9.1 时间序列分析概述232
      9.2 ARIMA模型233
      9.2.1 ARIMA模型的基本概念233
      9.2.2 ARIMA模型预测步骤234
      9.2.3 预测实例234
      9.3 HMM241
      9.3.1 HMM的基本概念241
      9.3.2 HMM的基本问题243
      9.3.3 HMM基本问题的解法244
      9.4 动态贝叶斯网络248
      9.4.1 动态贝叶斯网络的基本概念248
      9.4.2 动态贝叶斯网络的学习250
      9.4.3 动态贝叶斯网络的推理252
      9.5 应用实践252
      9.5.1 基于ARIMA模型的二氧化碳浓度预测252
      9.5.2 基于HMM的比特币投资预测258
      第10章 大数据工具271
      10.1 分布式系统概述272
      10.2 Hadoop概述273
      10.3 Hadoop伪分布式的安装和配置273
      10.3.1 安装前准备273
      10.3.2 安装Hadoop275
      10.3.3 伪分布式配置275
      10.4 MapReduce277
      10.4.1 MapReduce任务的工作流程278
      10.4.2 MapReduce编程280
      10.5 利用MapReduce中的矩阵相乘281
      10.5.1 数据准备281
      10.5.2 矩阵的存储方式282
      10.6 Hive286
      10.6.1 Hive简介286
      10.6.2 数据存储287
      10.6.3 用Python执行HQL命令288
      10.6.4 必知的HQL知识289
      10.6.5 HQL实例294
      10.7 HBase295
      10.7.1 数据模型296
      10.7.2 HBase的特点297
      10.7.3 获取数据297
      10.7.4 存储数据298
      第11章 基于卷积神经网络和深度
      哈希编码的图像检索方法301
      11.1 图像检索方法的发展历程302
      11.2 卷积深度哈希网络的基本框架303
      11.2.1 卷积子网络303
      11.2.2 损失函数304
      11.2.3 哈希层304
      11.3 实验结果与性能分析305
      11.3.1 神经网络参数305
      11.3.2 数据库和评价指标305
      11.3.3 实验结果分析306
      第12章 蛋白质作用网络模型310
      第13章 基于改进的长短期记忆网络的道路交通事故预测模型322
      第14章 大数据工作流的性能建模和预测364
      附录 数学基础知识379
      参考文献386

      内容摘要
      人们每天都会通过互联网、移动设备等产生海量数据,如何从其中洞悉这些数据背后所隐含的“真知灼见”,是我们研究它的意义所在。以前人们总说信息就是力量,现如今对大数据进行分析、利用和挖掘才是力量之所在。作为大数据方面的一部著作,本书是作者长期从事大数据、数据挖掘等科研工作的总结。其从大数据、数据挖掘、实际案例等三部分深入浅出地介绍了大数据领域的知识。
      第一部分是大数据篇,其主要从数据起源、生态系统、生命周期以及行业应用来分析大数据的研究方向和趋势。并就数据预处理、可视化、安全等大数据技术进行了详细的阐述,让深奥的知识浅显易懂;第二部分是数据挖掘认知篇,其主要从线性回归、聚类、关联规则、分类与预测、时间序列等方面剖析数据挖掘技术;第三部分是实践篇,其主要从业务和技术角度阐述已有的科研成果,让读者从理论到实践过程中深刻理解大数据的用途及技术的本质。
      本书的读者对象主要是从事智能信息处理、大数据、云服务等领域的科研工作者和广大工程技术人员,也可作为大学本科教材和自学读者用书。

      主编推荐
      本书包括了大数据分析相关技术的基本内容,同时又具有一定的深度和广度。希望通过本书的讲解,使读者既能了解大数据的概貌,又能把握大数据技术的靠前动态和发展趋势。

      配送说明

      ...

      相似商品

      为你推荐

    孔网啦啦啦啦啦纺织女工火锅店第三课

    开播时间:09月02日 10:30

    即将开播,去预约
    直播中,去观看