通用人工智能:初心与未来
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.1 智力测试

关于人类智能的研究工作主要在于理解人与人之间的个体差异上。例如,在20世纪初,阿尔弗雷德·比奈(Alfred Binet)被巴黎学校系统要求寻找一种方法来识别那些需要更多帮助才能获得有效教育的学生。为了解决这个问题,他和他的同事西奥多·西蒙(Theodore Simon)创建了一个智力测试,结合语言技能、记忆力、推理以及遵循命令和学习新知识能力等指标来进行智力评测。他们试图寻找一套与孩子已学习内容无关的衡量标准,因此尽量避免了对特定事实和其他明确知识的测试。他们所选取的各种测试指标很快被进一步扩展以用于许多其他方面的智力测试。

比奈意识到他的测试是有局限性的。他认为仅用考试分数并不能公正地反映学生的真实智力,虽然它可以很好地预测学生在学校的表现。与此相对的是,英国心理学家查尔斯·斯皮尔曼(Charles Spearman,1904)则提出:智力实际上是一种单一的品质,可以通过适当测试来衡量,并且可以用数字表示。

大多数智力测试包括对许多名义上的个人技能的评估。斯皮尔曼指出,在一项子任务中得分高的人通常在其他子任务上表现良好,而在某些子任务上表现不佳的人往往在其他子任务上也表现不佳(参见第1章)。斯皮尔曼发明了一些新的统计方法来评估这种相关性。他将这种新方法命名为“因素分析”(Factor analysis),以统计学方式将考生的表现划分为两种组成要素。在斯皮尔曼看来,学生在每个特定子任务的表现是由与该子任务相关的特定智能和有助于许多子任务表现的通用智能“g”两部分因素共同决定的。他认为,子任务之间的相关性是因为它们共享相同的通用智能因素。如果某人拥有更多的通用智能因素,则他往往会在大多数测试中表现良好;相反则会在大多数测试中表现不佳。

斯皮尔曼认为,通用智能因素是人类大脑或思想的某些生物学特征的结果,类似于心智力量。一些心理学家将通用智能归因于大脑大小或心理速度,用做出简单决策的速度来衡量。其他人则将其归因于记忆能力或视觉敏锐度等因素。

从统计学的角度来看,相关任务之间必然共享某些东西,但这不一定就是智能因素。心理状态(焦虑或冷静)、考试应对经验、注意力或动机等,都有可能构成共享因素的一部分。

另外,相关性可能还和测试任务之间的相似性有关。看似不同的测试任务可能共享一些相重叠的技能。例如,数字序列任务和渐进矩阵任务是两个用来测试智力的任务。在数字序列任务中,考生需要根据一组所呈现数字来预测后面的数字(例如,2、4、6、8序列后面的数字是什么?)。在渐进式矩阵任务中(图2-1),有一个特定模式的设计矩阵,学生需要按照该排列绘制出最终图案。这两项任务都要求学生根据各自的模式进行规律的发现和应用。换句话说,这两项任务所涉及的技能具有交集,而这会进一步导致相关性的出现。

图2-1 用于评估智力的渐进式矩阵任务的简单示例。第九个方框中应该绘制什么图案,从而与行和列中的前一个方框一致?

目前人类是否存在通用智能(至少如同智力测试所得出的那种通用智能)尚无定论。计算机科学家和心理学家一直在试图寻找它,但迄今为止它依然让人难以捉摸。

通过智力测试衡量的智能已被发现与许多方面的能力相关,但并不总如同我们所想象的那样。例如,研究发现智能与解决复杂问题的能力之间的关系就不像人们想象中那么强(Wenke、Frensch和Funke,2005)。