正版新书 新华官方库房直发 可开电子发票
-
作者:
肖芳,张良均 主编
-
出版社:
人民邮电出版社
-
ISBN:
9787115464880
-
出版时间:
2018-02
-
版次:
1
-
装帧:
平装
-
开本:
16开
-
纸张:
胶版纸
-
页数:
272页
-
字数:
406千字
-
作者:
肖芳,张良均 主编
-
出版社:
人民邮电出版社
-
ISBN:
9787115464880
-
出版时间:
2018-02
-
纸张:
胶版纸
-
页数:
272页
-
字数:
406千字
售价
¥
36.85
7.4折
定价
¥49.80
品相
全新品相描述
上书时间2024-05-07
卖家超过10天未登录
手机购买
微信扫码访问
-
-
商品描述:
-
作者简介:
张良均,高 级信息系统项目管理师,泰迪杯全国大学生数据挖掘竞赛的发起人。华南师范大学、广东工业大学兼职教授,广东省工业与应用数学学会理事。兼有大型高科技企业和高校的工作经历,主要从事大数据挖掘及其应用的策划、研发及咨询培训。全国计算机技术与软件专业技术资格(水平)考试继续教育和CDA数据分析师培训讲师。发表数据挖掘相关论文数二十余篇,已取得国家发明专利12项,主编图书《神经网络实用教程》《数据挖掘:实用案例分析》《Python数据分析与挖掘》等多本畅销图书,主持并完成科技项目9项。获得SAS、SPSS数据挖掘认证及Hadoop开发工程师证书,具有电力、电信、银行、制造企业、电子商务和电子政务的项目经验和行业背景。
内容简介:
本书以任务为导向,较为全面地介绍了Spark大数据技术的相关知识。全书共9章,具体内容包括Spark概述;Scala基础;Spark编程;Spark编程进阶;SparkSQL:结构化数据文件处理;SparkStreaming:实时计算框架;SparkGraphX:图计算框架;SparkMLlib:功能强大的算法库;项目案例:餐饮平台菜品智能推荐。本书的大部分章节都包含了实训与课后习题,通过练习和操作实践,帮助读者巩固所学的内容。
目录:
第 1章Spark概述1
任务1.1认识Spark1
1.1.1Spark的发展1
1.1.2Spark的特点2
1.1.3Spark生态圈4
1.1.4Spark的应用场景5
任务1.2搭建Spark环境5
1.2.1搭建单机版环境6
1.2.2搭建单机伪分布式环境6
1.2.3搭建接近分布式环境7
任务1.3了解Spark运行架构与原理10
1.3.1Spark集群架构11
1.3.2Spark作业运行流程11
1.3.3Spark核心数据集RDD15
1.3.4Spark核心原理17
小结19
第 2章Scala基础20
任务2.1Scala的简介与安装21
2.1.1Scala简介21
2.1.2Scala特性21
2.1.3Scala的环境设置及安装21
2.1.4运行Scala23
任务2.2定义函数识别号码类型24
2.2.1数据类型24
2.2.2常量和变量25
2.2.3表达式26
2.2.4数组27
2.2.5函数29
2.2.6任务实现31
任务2.3统计广州号码段数量32
2.3.1if判断32
2.3.2循环33
2.3.3任务实现34
任务2.4根据归属地对手机号码段分组34
2.4.1List35
2.4.2Set36
2.4.3Map37
2.4.4元组38
2.4.5函数组合器38
2.4.6任务实现39
任务2.5编写手机号码归属地信息查询程序40
2.5.1Scala类40
2.5.2S
...
孔网啦啦啦啦啦纺织女工火锅店第三课
开播时间:09月02日 10:30
即将开播,去预约
直播中,去观看