SAS技术内幕:从程序员到数据科学家
上QQ阅读APP看书,第一时间看更新

前言

本书是写给程序员的数据分析技术入门书籍,成书于2017年作者在北京大学教授面向研究生和高年级本科生的“统计分析与商务智能”选修课期间,它试图在程序世界和数据分析世界之间架起一座坚实的桥梁。

本书主要包括上下两卷内容:程序员视角下的SAS编程技术和数据结构,数据科学家视角下的数据分析理论和SAS实践。

上卷主要包括SAS语言入门、数据集与DATA步、变量与表达式、流程控制、函数封装、SAS宏、DS2、代码组织、文件读写、按位运算以及扩展SAS功能。另外,还从程序员的视角阐述了各种数据结构在SAS中的编程实现和应用,包括SAS数组、队列与堆栈、链表、二叉树、矩阵运算和图等。

下卷包括统计学基础、大数定律与中心极限定理、统计分布、方差分析、数据标准化、主成分分析与因子分析、相关分析与回归分析、聚类分析、神经网络,最后以π值高精度求解和探索分析结束。

本书内容涵盖理论和实践,章节组织采用从简单到复杂的方式。本书囊括数据分析技术方面较为核心的基础内容,试图与读者一起触及数据世界分析与智能的核心。各章为读者提供简洁可运行的SAS示例代码、算法实现以及快速指南,为广大受过计算机科学教育的程序员向数据科学家华丽转身提供了必要的快速入门指导。本书附录还提供二项分布、泊松分布和标准正态分布累积概率表以及t分布、χ2分布和F分布临界值表的制作与查找方法。本书适用于各大专院校统计分析专业和信息处理专业的学生,有志于从事数据分析的广大程序员、统计分析从业人员以及所有想成为数据科学家的专业人士。

本书与传统的SAS数据分析书籍不同之处在于,它从程序员的视角出发,循序渐进探讨数据分析的各个方面,避免“知其然而不知其所以然”。因此,阅读本书可使你从完全不了解SAS到对SAS“有所了解”,从而掌握数据分析的要义和精髓,实现从程序员到数据科学家的华丽转身!

最后,诚挚感谢北京大学信息科学技术学院博士生导师、中国ACM教育专委会主席张铭教授为本书作序。感谢SAS中国研发中心总经理刘政博士给予的大力帮助和指导,感谢SAS大中华区前市场总监蒋顺利先生、高级市场经理曾秋媚女士在写作过程中给予的帮助和支持,感谢在写作过程中给予特别帮助的SAS中国研发中心的同仁们。感谢清华大学出版社编辑部的刘洋先生和全体同仁的辛勤工作,是他们的努力使本书得以与读者见面!感谢恩师陈永金先生以及所有在我生命中给予帮助的人们!特别感谢与我一路同行的知己和家人,是他们赋予了我生命的色彩与力量!

巫银良

20188