数据科学技术文本分析和知识图谱数据库苏海波等新华正版

作者: 苏海波等
出版社: 清华大学出版社
ISBN: 9787302649700
出版时间: 2024-01
版次: 1

装帧: 平装
开本: 16
页数: 344页
字数: 580千字

作者: 苏海波等
出版社: 清华大学出版社
ISBN: 9787302649700

出版时间: 2024-01
版次: 1
装帧: 平装

开本: 16
页数: 344页
字数: 580千字

售价 76.10 5.9折

定价￥129.00

品相全新品相描述

优惠

运费

本店暂时无法向该地区发货

延迟发货说明

时间：

说明：

上书时间2024-05-12

数量: 库存16件

立即购买加入购物车收藏

卖家超过10天未登录

商品详情
店铺评价

手机购买

微信扫码访问

商品分类：

计算机与互联网

货号：

700_9787302649700

品相描述：全新

正版特价新书

商品描述：

主编：

数据科学技术：文本分析和知识图谱是一本深入浅出的数据科学技术指南。书中详细介绍了文本分析和知识图谱等关键技术，结合典型案例展示了数据科学在安全、应急等行业的应用实践。无论你是数据科学领域的专业人士还是对数据科学感兴趣的读者，这本书都能帮助你深入了解数据科学的基本概念、方法和近期新技术。通过学数据科学技术：文本分析和知识图谱，你将能够掌握数据科学的核心知识，为自己的职业发展和创新项目提供有力支持。

目录：

章什么是数据科学1

1.1数据科学的定义1

1.1.1数据科学的背景1

1.1.2数据科学的定义1

1.2数据科学的关键技术3

1.2.1数据存储计算5

1.2.2数据治理12

1.2.3结构化数据分析28

1.2.4语音分析44

1.2.5视觉分析55

1.2.6文本分析61

1.2.7知识图谱65

1.3本章小结65

1.4题66

1.5本章参文献66

第2章文本预训练模型68

2.1文本分析技术的发展史68

2.2transformer模型结构70

2.3预训练模型的结构和变种75

2.4加速处理器gpu和tpu79

2.4.1gpu的介绍79

2.4.2gpu产品命名80

2.4.3tpu和gpu的区别83

2.4.4tpu的使用结84

2.5预训练模型的常见问题87

2.5.1模型输入的常见问题87

2.5.2模型的常见问题90

2.5.3模型进化的常见问题94

2.6预训练模型的源码解读96

2.6.1模型架构96

2.6.2bertmodel96

2.6.3bert预训练任务107

2.6.4bert微调112

2.7本章小结114

2.8题114

2.9本章参文献115

第3章多语种文本分析116

3.1多语种文本分析背景介绍116

3.2多语种文本分析技术116

3.2.1polyglot技术116

3.2.2multilingualbert117

3.2.3xlm多语言模型117

3.2.4xlmr多语言模型119

3.2.5模型实验效果120

3.3多语种文本分析源码解读121

3.4本章小结125

3.5题126

3.6本章参文献126

第4章文本情感分析127

4.1情感分析背景介绍127

4.2情感分析技术127

4.2.1目标和挑战127

4.2.2技术发展历程129

4.2.3情感分析的需求分析133

4.2.4情感分析的落地实践134

4.2.5模型开发台的构建137

4.3情感分析比赛和方案144

4.3.1背景介绍144

4.3.2方案介绍146

4.3.3数据清洗和增广147

4.3.4多模态融合147

4.3.5机器学148

4.4情感分析源码解读151

4.4.1f1值适应优化代码151

4.4.2对抗训练代码152

4.5本章小结154

4.6题154

4.7本章参文献155

第5章文本机器翻译156

5.1机器翻译背景介绍156

5.2机器翻译技术157

5.2.1基于规则的机器翻译157

5.2.2统计机器翻译158

5.2.3神经网络机器翻译159

5.2.4encoder-decoder模型161

5.2.5注意力机制模型162

5.2.6级神经网络实践164

5.3机器翻译比赛和方案167

5.3.1wmt21翻译任务167

5.3.2wmt22翻译任务168

5.4机器翻译源码解读169

5.4.1通用框架介绍169

5.4.2翻译模型实现170

5.5本章小结180

5.6题181

5.7本章参文献181

第6章文本智能纠错183

6.1文本纠错背景介绍183

6.2文本智能纠错技术184

6.2.1智能纠错的意义和难点185

6.2.2智能纠错解决的问题185

6.2.3业界主流解决方案186

6.2.4技术方案实践190

6.3文本智能纠错技术193

6.3.1比赛介绍193

6.3.2校对问题思194

6.4纠错方案和源码解读195

6.4.1gector解读195

6.4.2macbert解读199

6.4.3pert解读200

6.4.4plome解读202

6.4.5比赛方案203

6.5本章小结204

6.6题205

6.7本章参文献205

第7章知识图谱构建206

7.1知识图谱背景介绍206

7.1.1知识和知识图谱206

7.1.2知识获取、知识抽取与信息抽取的区别207

7.1.3知识图谱构建范式208

7.2非结构化信息抽取技术211

7.2.1信息抽取框架211

7.2.2命名实体识别212

7.2.3关系识别213

7.2.4事件抽取215

7.3生成式统一模型抽取技术216

7.4模型源码解读220

7.5本章小结224

7.6题224

7.7本章参文献225

第8章知识图谱问答226

8.1背景介绍226

8.2知识图谱问答技术229

8.2.1信息检索方法229

8.2.2语义解析方法231

8.3方案和源码解读233

8.3.1nl2sparql233

8.3.2nl2sparql语义解析方案234

8.3.3t5、bart、unilm模型简介234

8.3.4t5、bart、unilm方案236

8.3.5训练t5、bart、unilm生成模型237

8.3.6语义排序方案和代码239

8.3.7sparql修正代码241

8.4本章小结245

8.5题245

第9章结构化知识nl2sql问答246

9.1nl2sql背景介绍246

9.2nl2sql技术249

9.2.1nl2sql技术路线249

9.2.2nl2sql项目实践255

9.3nl2sql比赛和方案256

9.4nl2sql源码解读259

9.5本章小结269

9.6题269

9.7本章参文献270

0章chatgpt大语言模型271

10.1chatgpt介绍271

10.1.1chatgpt的定义和背景271

10.1.2chatgpt的发展历程272

10.2gpt模型概述272

10.2.1gpt-1模型的272

10.2.2gpt-2模型的273

10.2.3gpt-3模型的275

10.3chatgpt的实现277

10.3.1大模型的微调技术277

10.3.2chatgpt的能力来源278

10.3.3chatgpt的预训练和微调279

10.4chatgpt的应用282

10.4.1chatgpt提示工程282

10.4.2chatgpt应用场景283

10.4.3chatgpt的优缺点284

10.5开源大模型285

10.5.1chatglm大模型285

10.5.2llama大模型288

10.6本章小结294

10.7题294

10.8本章参文献295

1章行业实践案例296

11.1智慧政务实践案例296

11.1.1案例背景296

11.1.2解决方案297

11.1.3系统架构和实现299

11.1.4案例结307

……

内容简介：

数据科学的关键技术包括数据存储计算、数据治理、结构化数据分析、语音分析、视觉分析、文本分析和知识图谱等方面。本书的重点是详细介绍文本分析和知识图谱方面的技术。文本分析技术主要包括文本预训练模型、多语种文本分析、文本情感分析、文本机器翻译、文本智能纠错、nl2ql问答以及chatgpt大语言模型等。知识图谱技术主要包括知识图谱构建和知识图谱问答等。本书将理论介绍和实践相结合，详细阐述各个技术主题的实现路线，并对应用于业界算法大赛中的技术方案和进行源代码解读，帮助读者深入理解技术。后，本书还介绍了文本分析和知识图谱技术在政务、公共安全、应急等多个行业中的智能应用实践案例。
数据科学技术：文本分析和知识图谱适合具备python和机器学技术基础的高等院校、文本分析（或者自然语言处理）以及知识图谱领域的算法工程师和研究机构的研究者阅读，也适合数据科学和人工智能领域的研究者作为参书。

作者简介：

"苏海波，清华大学电子工程系博士，副研究员，百分点科技首席算法科学家。擅长人工智能领域的自然语言理解、知识图谱、深度学、个化以及计算广告技术，有丰富的研发实践经验；曾职于，负责广告系统的算法效果优化，以及信息流产品整体算法策略的设计及研发；现负责百分点大数据与人工智能核心算法，带领团队研发智能校对系统、智能问答系统、知识图谱系统等多款认知智能产品，荣获业界多项奖项，并获得不错的商业化落地效果。
多篇ci和ei发表于 globe、icc、ieice tranaction 等国外很好学术会议和期刊，获得发明专利20余项，曾担任科技部重点研发计划子课题负责人。获得2019年和2020年北京市科学技术进步奖，获得2019年全球人工智能与机器学大会（aicon）明星讲师，指导团队获得2021 cck（知识图谱与语义计算大会）知识图谱问答大赛的季军。"
配送说明

...
相似商品
为你推荐

孔网分类

图书

图书

数据科学技术 文本分析和知识图谱 数据库 苏海波 等 新华正版

孔网啦啦啦啦啦纺织女工火锅店第三课

数据科学技术文本分析和知识图谱数据库苏海波等新华正版