大数据挖掘与统计机器学习
上QQ阅读APP看书,第一时间看更新

总序

统计学是收集、分析、展示和解释数据的方法性质的一门科学。信息技术的蓬勃发展,使统计在经济、社会、管理、医学、生物、农业、工程等领域有了越来越多、越来越深入的应用。2011年2月,国务院学位委员会第28次会议通过了新的《学位授予和人才培养学科目录(2011)》,将统计学上升为一级学科,这为统计学科建设与发展提供了难得的机遇。

一般认为,麦肯锡公司的研究部门——麦肯锡全球研究院(MGI),在2011年首先提出了大数据时代(ageofbigdata)的概念,并引起了全球广泛的反响。大数据是指随着现代社会的进步和信息通信技术的发展,在政治、经济、社会、文化等各个领域形成的规模巨大、增长与传递迅速、形式复杂多样、非结构化程度高的数据或者数据集。它的来源包括传感器、移动设备、在线交易、社交网络等,其形式可以是各种空间数据、报表统计数据、文字、声音、图像、超文本等各种环境和文化数据信息等。大数据时代是一个海量数据开始广泛出现、海量数据的运用逐渐普遍的新的历史时期,也是我们需要认真研究与应对的一个新的社会环境与社会形式。

大数据时代对统计专业的学生提出了更高的要求。他们不仅需要具有扎实的统计理论基础,并且要熟练掌握各种处理大数据和统计模型分析的计算机技能,还要懂得如何提出研究问题、如何判断数据质量、如何评价模型和方法,以及如何准确清晰地呈现分析结果。这对统计教育和人才培养提出了新的目标和方向。