技术教育社区
www.teccses.org

数据挖掘十大算法

封面

作者:(美)吴信东库玛尔

页数:154

出版社:清华大学出版社

出版日期:2013

ISBN:9787302310617

电子书格式:pdf/epub/txt

内容简介

《世界著名计算机教材精选:数据挖掘十大算法》详细介绍了在实际中用途最广、影响最大的十种数据挖掘算法,这十种算法是数据挖掘领域的顶级专家进行投票筛选的,覆盖了分类、聚类、统计学习、关联分析和链接分析等重要的数据挖掘研究和发展主题。《世界著名计算机教材精选:数据挖掘十大算法》对每一种算法都进行了多个角度的深入剖析,包括算法历史、算法过程、算法特性、软件实现、前沿发展等,此外,在每章最后还给出了丰富的习题和精挑细选的参考文献,对于读者掌握算法基本知识和进一步研究都非常有价值,对数据挖掘、机器学习和人工智能等学科的课程的设计有指导意义。

作者简介

吴信东(Xindong Wu),教授英国爱丁堡大学人工智能学博士,任美国佛蒙特大学计算机科学系主任。吴教授在数据挖掘、知识系统和Web信息开发等研究领域内颇有建树,在IEEE TKDE、TPAMI、ACMTOIS、DMKD、KAIS、IJCAI、AAAI、ICMI_、KDD、ICDM和WWW等学术会议和期刊上发表了170余篇学术论文,另外,还出版了18部学术专著和会议文集。他还获得了IEEE ICTAI-2005的论文奖和IEEE ICDM-2007的理论/算法论文奖亚军。
吴博士是IEEE Transactzons on KnowLedge and Data Engineering(TKDE,由IEEE Computer Society主办)的主编,IEEE International Con erence on Data Mining (ICDM)的创始人和指导委员会主席,Knowledge and In ormation Systems(KAIS,由Springer发行)的创办人和荣誉主编,IEEE Computer Society Technical Committee on Intelligent Informatics(TCII)的创始主席(2002-2006),Springer Advanced Information and Knowledge Processing (AI& KP)系列著作的编辑。他还是ICDM’03(the 2003 IEEE International Conference on Data Mining)程序委员会主席和KDD-07(the 13th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining)程序委员会联合主席。他获得了2004 ACM SIGKDD服务奖、2006 IEEE ICDM杰出服务奖,是2005年合肥科技大学“长江学者奖励计划”讲座教授。他还是很多学术会议的特邀专家/专题报告人,如NSF-NGDM’07、PAKDD-07、IEEE EDOC’06、IEEE ICTAI’04、IEEE/WIClACM WI’04lIAT’04、SEKE 2002和PADD-97等。

Vipin Kumar,教授,明尼苏达大学计算机科学与工程系William Norris讲席教授、系主任。他于1977年获得印度鲁尔基理工学院(正式名称是鲁尔基大学)的电子和通信工程学士学位,1979年获得荷兰埃因霍温飞利浦国际学院的电子工程硕士学位,1982年获得马里兰大学帕克分校的计算机科学博士学位。Kumar教授的研究兴趣主要集中在数据挖掘、生物信息学和高性能计算领域。他提出了评估并行算法可扩展性的恒等效率度量指标,并研发了多款稀疏矩阵分解(PSPASES)和图剖分(METIS,ParMctis, hMetis)的高效并行算法及软件。他发表了200多篇研究论文,合编合著了9本学术专著,包括被广泛使用的教科书Introduction to Parallel Computing和Introduction to Data Mining,者5由Addison-Wesley出版。Kumar是众数据挖掘和多并行计算领域的学术会议、专题研讨会的主席或共同主席,女口IEEE International Con ference on Data Mining(2002)、International Parallel and Distributed Processing Symposium(2001)和SIAM International Con ference on Data Mining(2001).Kumar是SIAM International Conference on Data Mining指导委员会共同主席,IEEE International Conference on Data Mining和IEEE International Conference on Bioinformatics and Biomedicine指导委员会委员。Kumar是Journal of Statistical Analysis and Data Mining的创始主编之——,IEEE Intelligent In ormatics Bulletin主编和Data Mining and Knowledge Discovery系列图书(由CRC Press/Chapman Hall出版)的编辑。Kumar还担任很多其他学术刊物的编辑,如Data Mining and Kno-wledge Discovery、KnowLedge and Information Systems、IEEE Computational Inteltigence Bulletin、Annual Review of Inteltigent In formatics、Parallel Com puting、Journal of Parallel and Distributed Computing、IEEE Transactions of Data and Kno-wledge Engineering(1993-1997)、IEEE Concurrency(1997-2000)和IEEE ParalleL and Distributed Technology(1995-1997)等。他是ACM会士、IEEE会士、AAAS会士和SIAM会员。Kumar由于在并行算法设计、图剖分和数据挖掘领域的杰出贡献,获得了2005 IEEE Computer Society的技术成就奖。

本书特色

吴信东和库玛尔编著的《数据挖掘十大算法》详细介绍了在实际中用途最广、影响最大的十种数据挖掘算法,这十种算法是数据挖掘领域的顶级专家进行投票筛选的,覆盖了分类、聚类、统计学习、关联分析和链接分析等重要的数据挖掘研究和发展主题。在每章最后还给出了丰富的习题和精挑细选的参考文献,对于读者掌握算法基本知识和进一步研究都非常有价值,对数据挖掘、机器学习和人工智能等学科的课程的设计有指导意义。

目录

第1章C4.511.1引言21.2算法描述31.3算法特性61.3.1决策树剪枝61.3.2连续型属性81.3.3缺失值处理81.3.4规则集诱导91.4软件实现101.5示例101.5.1Golf数据集101.5.2Soybean数据集111.6高级主题111.6.1二级存储121.6.2斜决策树121.6.3特征选择121.6.4集成方法121.6.5分类规则131.6.6模型重述131.7习题14参考文献15第2章k瞞eans182.1引言192.2算法描述192.3可用软件222.4示例232.5高级主题272.6小结282.7习题28参考文献29第3章SVM: 支持向量机313.1支持向量分类器323.2支持向量分类器的软间隔优化343.3核技巧353.4理论基础383.5支持向量回归器403.6软件实现413.7当前和未来的研究413.7.1计算效率413.7.2核的选择413.7.3泛化分析423.7.4结构化支持向量机的学习423.8习题43参考文献44第4章Apriori474.1引言484.2算法描述484.2.1挖掘频繁模式和关联规则484.2.2挖掘序列模式524.2.3讨论534.3软件实现544.4示例554.4.1可行示例554.4.2性能评估604.5高级主题614.5.1改进Apriori类型的频繁模式挖掘614.5.2无候选的频繁模式挖掘624.5.3增量式方法634.5.4稠密表示: 闭合模式和最大模式634.5.5量化的关联规则644.5.6其他的重要性/兴趣度度量方法654.5.7类别关联规则664.5.8使用更丰富的形式: 序列、树和图664.6小结674.7习题67参考文献68第5章EM725.1引言735.2算法描述745.3软件实现745.4示例755.4.1例5.1: 多元正态混合755.4.2例5.2: 混合因子分析785.5高级主题805.6习题81参考文献87第6章PageRank906.1引言916.2算法描述926.3一个扩展: Timed睵ageRank956.4小结966.5习题96参考文献97第7章AdaBoost987.1引言997.2算法描述997.2.1符号定义997.2.2通用推举过程1007.2.3AdaBoost算法1017.3示例1037.3.1异或问题求解1037.3.2真实数据上的性能1047.4实际应用1057.5高级主题1077.5.1理论问题1077.5.2多类别AdaBoost1107.5.3其他高级主题1117.6软件实现1117.7习题112参考文献113第8章kNN: k最近邻1158.1引言1168.2算法描述1168.2.1宏观描述1168.2.2若干议题1178.2.3软件实现1188.3示例1188.4高级主题1208.5习题121致谢121参考文献122第9章Naive Bayes1249.1引言1259.2算法描述1259.3独立给力1279.4模型扩展1289.5软件实现1309.6示例1309.6.1例11309.6.2例21329.7高级主题1339.8习题133参考文献134第10章CART: 分类和回归树13610.1前身13710.2概述13810.3示例13810.4算法描述14010.5分裂准则14110.6先验概率和类别均衡14210.7缺失值的处理14410.8属性的重要度14510.9动态特征构造14610.10代价敏感学习14710.11停止准则、剪枝、树序列和树选择14710.12概率树14910.13理论基础15010.14CART之后的相关研究15010.15可用软件15110.16习题152参考文献153

节选

吴信东和库玛尔编著的《数据挖掘十大算法》详细介绍了在实际中用途最广、影响最大的十种数据挖掘算法,这十种算法是数据挖掘领域的顶级专家进行投票筛选的,覆盖了分类、聚类、统计学习、关联分析和链接分析等重要的数据挖掘研究和发展主题。在每章最后还给出了丰富的习题和精挑细选的参考文献,对于读者掌握算法基本知识和进一步研究都非常有价值,对数据挖掘、机器学习和人工智能等学科的课程的设计有指导意义。

下载地址

立即下载

(解压密码:www.teccses.org)

Article Title:《数据挖掘十大算法》
Article link:https://www.teccses.org/341713.html