成功加入购物车
图书条目标准图
许云峰 、 徐华 、 张妍 、 王杨君 、 马瑞 著 / 北京邮电大学出版社有限公司 / 2016-08 / 平装
售价 ¥ 3.88 1.1折
定价 ¥35.00
品相 九品
优惠 满包邮
延迟发货说明
上书时间2023-07-29
卖家超过10天未登录
大数据技术及行业应用
如何定义大数据?如何应用大数据?什么是大数据思维?如何学习大数据?如何构建大数据平台?如何在行业中应用大数据?这一系列的问题,是当前在大数据热的时代背景里,让人感到非常迷茫的问题。《大数据技术及行业应用》直面这些问题,在从业者角度解答以上问题,希望能给大数据行业的初学者提供一些帮助。
第1章 大数据相关概念1.1 什么是大数据?1.2 大数据有多大?1.3 大数据是一种思维方式1.4 大数据思维的应用案例1.5 大数据是如何产生的?1.6 美国和中国的大数据产业生态系统1.7 如何学习大数据技术本章小结参考文献第2章 搭建私有大数据处理平台2.1 FreeBSD操作系统安装2.2 基础软件安装2.2.1 安装Java运行环境2.2.2 安装bash2.3 Hadoop安装配置2.3.1 系统规划2.3.2 配置conf/masters、con.f/slaves文件2.3.3 Hadoop安装2.4 Hadoop开发环境配置2.4.1 编译Hadoop-eclipse-plugin-1.1.2.jar插件2.4.2 eclipse配置2.4.3 测试2.5 Hadoop升级2.6 Zookeeper安装2.6.1 在FreeBSD上安装Zookeeper2.6.2 启动并测试Zookeeper2.7 HBase安装配置2.8 FreeBSD上网配置2.8.1 VPN上网配置2.8.2 网页认证上网配置2.9 配置杀毒软件本章小结第3章 大数据平台虚拟化解决方案3.1 Ubuntu上安装Docker3.1.1 Docker简介3.1.2 Docker安装3.1.3 Docker镜像相关命令3.1.4 Docker容器相关命令3.1.5 Dockerfile创建镜像3.1.6 Docker实现Spark集群3.1.7 Docker集中化Web界面管理平台shipyard3.1.8 DockerUI3.2 OpenStack搭建3.2.1 下载工具和镜像3.2.2 配置网桥3.2.3 安装fuel3.2.4 安装OpenStack平台3.2.5 使用OpenStack平台本章小结参考文献第4章 大数据平台解决方案4.1 大数据平台比较4.2 CDH大数据平台搭建4.2.1 Cloudera Manager安装4.2.2 添加服务4.3 HDP大数据平台搭建4.3.1 部署Ambari4.3.2 用Amban_web部署HDP平台本章小结第5章 Spark在大数据处理中的应用5.1 Spark集群搭建5.1.1 Scala在Ubuntu下的安装和配置5.1.2 Spark集群搭建5.1.3 Spark集群启动测试5.2 Spark-shell统计社交网络中节点的度5.2.1 启动HDFS和Spark5.2.2 运行Spark-shell5.2.3 统计社交网络中节点的度5.3 Spark GraphX5.3.1 属性图5.3.2 图操作5.3.3 构建图5.3.4 图计算相关算法5.3.5 GraphX图计算实例本章小结参考文献第6章 大数据技术在环境科学中的应用6.1 大气环境科学的数值模式的介绍6.1.1 气象模式6.1.2 区域空气质量模式6.2 高分辨率实时观测的大数据本章小结参考文献第7章 大数据在DrugBank药物数据库聚类方面的应用7.1 简介7.2 开发环境及编程语言7.3 算法设计7.3.1 算法设计流程7.3.2 相似度的计算7.4 算法实现7.4.1 文件的解析7.4.2 对靶标、作用酶的分析7.4.3 对分子中原子百分比的处理过程7.4.4 结果的整合7.4.5 最终结果展示本章小结参考文献第8章 大数据在电子商务数据分析中的应用8.1 研究现状8.2 相关技术及概念8.2.1 网络爬虫8.2.2 HtmlUnit工具包8.2.3 Mahout8.2.4 朴素贝叶斯算法8.2.5 文档向量8.2.6 TF-IDF改进加权8.2.7 中文分词8.3 需求分析8.3.1 系统功能8.3.2 系统界面8.4 概要设计8.4.1 系统模块设计8.4.2 数据库设计8.5 详细设计8.5.1 用户登录模块8.5.2 爬虫管理模块8.5.3 算法管理模块8.5.4 用户管理模块8.6 系统测试8.6.1 训练集准备8.6.2 新数据准备8.6.3 训练模型8.6.4 数据分类8.6.5 分类结果分析本章小结参考文献第9章 大数据技术在社交网络研究中的应用9.1 社区发现研究简介9.2 社区发现相关研究工作9.2.1 相关工作9.2.2 研究动机9.3 模型与问题的形式化9.3.1 社区森林模型9.3.2 问题形式化9.4 骨干度算法9.4.1 骨干度算法框架9.4.2 算法的时间复杂度9.4.3 算法比较9.5 实验分析9.5.1 数据集9.5.2 一个特定人际关系网络的测试9.5.3 Zachary的空手道俱乐部测试9.5.4 美国大学橄榄球队9.5.5 安然电子邮件公司数据集9.5.6 DBLP合作网络9.5.7 结论本章小结参考文献第10章 大数据技术在文本挖掘和情感分类中的应用10.1 研究综述lO.1.1 基于产品特征的观点挖掘研究10.1.2 产品评论结构化信息抽取方法10.1.3 评论信息分类相关研究方法10.2 评论文本的结构化信息抽取10.2.1 产品特征抽取10.2.2 基于关联规则抽取评论的隐式特征10.2.3 基于监督学习抽取评论的隐式特征10.3 情感分类研究综述10.3.1 基于词典与语言规则进行情感分类10.3.2 观点挖掘结果归纳10.4 算法评估结果与分析10.4.1 隐式特征抽取实验结果及分析10.4.2 篇章 粒度情感分类实验结果及分析10.4.3 语句粒度情感分类实验结果及分析本章小结参考文献第11章 大数据技术在电力系统中的应用11.1 一种云可视化机网协调控制响应特性数据挖掘方法11.1.1 技术领域11.1.2 背景技术11.1.3 方案内容11.2 基于电力数据分析的河北南网电力市场化风险对冲方法11.2.1 电网对发电侧市场化风险对冲分析11.2.2 电网对用电侧市场化风险对冲分析11.2.3 基于方差偏离规律的统计套利对冲方法本章小结附录 FreeBSD操作系统安装
展开全部
配送说明
...
相似商品
为你推荐
开播时间:09月02日 10:30