成功加入购物车
正版书籍 高温消毒 放心购买 15点前订单当天发货 书名于图片不符时以图片为准
刘伍颖 编 / 国防工业出版社 / 2014-10 / 平装
售价 ¥ 25.00 8.9折
定价 ¥28.00
品相 九品
优惠 满包邮
延迟发货说明
上书时间2024-05-14
卖家超过10天未登录
面向大数据的高效能垃圾文本分类
《面向大数据的高效能垃圾文本分类》全面介绍了大数据时代垃圾信息的爆发态势和文本特性,并根据信息文档的多域结构特性和文本Token频率分布的幂律特性,提出了多域学习的思想。研究了一整套面向大数据的高效能垃圾文本分类方法。
《面向大数据的高效能垃圾文本分类》共分7章,第1章分析大数据时代垃圾信息态势,第2章概述垃圾信息过滤方法,第3章研究电子邮件文档和手机短信文档的文本特性,第4章研究多域学习总体框架,第5章提出基于Token频率索引的文本分类算法,第6章研究有监督反馈代价问题,第7章设计面向大数据的高效能垃圾文本过滤系统。
《面向大数据的高效能垃圾文本分类》可以作为普通高等院校、科研机构大数据计算技术相关专业高年级本科生或研究生的实验教材,也可供网络信息技术公司高级研究人员参考。
刘伍颖(1980.01-),男,江西九江人,博士,讲师。毕业于国防科学技术大学计算机学院,分别于2002年、2005年、2011年获得计算机科学与技术专业学士、硕士、博士学位。已在SIGIR、AIRS、KnowledgeandInformationSystems等国内外学术会议和期刊上发表论文30余篇,其中被scI检索4篇,被cPcI―s检索4篇,被EI核心检索12篇。获得智能摘要软件等计算机软件著作权3项。主持科研项目2项。主要研究领域为自然语言处理(信息检索、信息过滤、机器翻译、自动文摘)和人工智能(机器学习、数据挖掘、文本分类)。
第1章大数据与垃圾信息1.1大数据时代的垃圾信息1.1.1大数据和垃圾信息爆发1.1.2垃圾信息过滤研究项目1.1.3垃圾信息过滤研究意义1.2垃圾信息范畴1.2.1垃圾电子邮件1.2.2垃圾手机短信1.2.3广义垃圾信息1.2.4文本垃圾信息1.3文本垃圾信息态势1.3.1国际垃圾邮件态势1.3.2我国垃圾邮件态势1.3.3我国垃圾手机短信态势1.4研究动机与内容1.4.1科学问题与挑战1.4.2研究内容与结构1.4.3研究成果本章小结第2章垃圾信息过滤方法概述2.1基于协议的垃圾信息过滤2.1.1基于SMTP的方法2.1.2基于IP的方法2.2基于内容的垃圾信息过滤2.2.1基于规则的方法2.2.2基于统计的方法2.2.3神经网络方法2.2.4集成学习方法2.3垃圾信息过滤性能评价方法2.3.1当前性能评价方法2.3.2ROC曲线评价方法2.3.3整体性能评价方法本章小结第3章信息文档的文本统计特性3.1信息文档的正文特性3.1.1电子邮件和手机短信语料3.1.2正文文本长度特性3.1.3正文和TokeN重复特性3.2信息文档的结构特性3.2.1信息文档格式3.2.2域间文本特征3.3Token频率分布的幂律特性3.3.1幂律3.3.2邮件文档和邮件域文档3.3.3短信文档和短信域文档本章小结第4章面向垃圾信息过滤的多域学习文本分类4.1问题描述与框架4.1.1形式化描述4.1.2多域学习框架4.2分割策略4.2.1自然域文档分割策略4.2.2特定属性域文档分割策略4.3组合策略4.3.1均权组合策略4.3.2支持向量模型权组合策略4.3.3域分类器历史性能权组合策略I.4.3.4域文档信息量权组合策略4.3.5复合权组合策略4.4实验结果4.4.1TREC07P上的bogo实验4.4.2TREC07P上的tftS3F实验4.4.3CSMS-P上的bogo实验4.4.4CSMS-P上的tftS3F实验本章小结第5章面向垃圾信息过滤的时空高效文本分类5.1基于Token频率索引的文本分类算法5.1.1统计原理5.1.2Token频率索引5.1.3算法描述5.2算法复杂度分析5.2.1时间复杂度5.2.2空间复杂度5.3基于多类别Token频率索引的文本分类算法5.3.1Token频率统计特性5.3.2多类别Token频率索引5.3.3算法描述5.4实验结果5.4.1TREC07P上的ffibtc实验5.4.2CSMS-P上的ffibtc实验5.4.3TanCorp-12上的mtfibtc实验本章小结第6章面向垃圾信息过滤的主动学习文本分类6.1问题描述与框架6.1.1形式化描述6.1.2主动多域学习框架6.2主动学习策略6.2.1时序优先主动学习策略6.2.2先验区间主动学习策略6.2.3基于方差的非确定采样主动学习策略6.3实验结果6.3.1TREC07P上的10000反馈tfibtc.cs5实验6.3.2TREC07P上的1000反馈ffibtc.cs5实验6.3.3CSMS-P上的10000反馈tfibtc.cs5实验6.3.4CSMS-P上的1000反馈tfibtc.cs5实验本章小结第7章面向大数据的高效能垃圾文本过滤系统7.1研究结论7.1.1多域学习框架的有效性7.1.2NFD和ASFD分割策略的有效性7.1.3复合权组合策略的最优性7.1.4基于TFI的文本分类算法的时空高效性7.1.5基于方差的非确定采样主动学习策略的有效性7.2高效能垃圾文本过滤系统设计7.2.1多Cluster垃圾文本过滤系统7.2.2多语种大数据深度舆情系统7.2.3个性化垃圾邮件过滤系统本章小结参考文献
展开全部
配送说明
...
相似商品
为你推荐
开播时间:09月02日 10:30