
上QQ阅读APP看书,第一时间看更新
三
迄今为止,五校联合大数据分析硕士实验班已经成功开展两届。在此基础上,课程组全体教师及时收集学生反馈意见,积极组织讨论,联合中国人民大学出版社,启动了“大数据分析统计应用丛书”的编写工作。
本套丛书第一期出版四本。《大数据分析计算机基础》着重介绍数据分析必备的计算机技能,包括Linux操作系统与shell编程,数据库操作与管理;面向大数据分析的计算机编程能力,我们重点推荐了Python语言。《大数据探索性分析》的内容包括大数据抽样、预处理、探索性分析、可视化以及时空大数据案例。《大数据分布式计算与案例》介绍了单机并行计算以及Hadoop分布式计算集群,在此基础上介绍了HDFS文件管理系统以及Map Reduce框架、各种统计模型的Map Reduce实现,此外还介绍了处理大数据最常使用的Hive,HBase,Mahout以及Spark等工具。《大数据挖掘与统计机器学习》介绍了常用的统计学习的回归和分类模型、模型评价与选择的方法、聚类和推荐系统等算法,所有方法均配有R语言实现案例,支持向量机和深度学习方法给出了Python实现案例,最后是两个数据量在10G以上的大数据案例分析,所有的数据和程序均可下载。相信读者在学习本套丛书的过程中,数据处理与分析能力会得到锻炼和提高。
在丛书第一期的基础上,我们也在积极策划第二期,内容包括非结构化大数据分析、大数据统计模型、统计计算与统计优化方法等,希望可以涵盖更多的数据类型与统计方法。
该丛书面向的读者主要是应用统计专业硕士,也可以作为统计专业高年级本科生、其他专业的本科生、研究生以及对大数据分析有兴趣的从业人员的参考书,希望这套丛书可以为我国大数据分析人才的培养奉献我们的绵薄之力。
丛书编委会