6.5 云模型理论简介
6.5.1 云模型概述
在20世纪90年代,我国著名教授李德毅以传统概率论和模糊集合理论为基础,提出一种在信息不完备条件下将特征因素的定性语义表述经过模糊性和随机性映射处理后转化为更准确的定量表达的不确定性人工智能理论,即云模型。
任何信息系统都具有一定程度的复杂性、不确定性和模糊性,这是客观事实。加深对云模型的理解应当从两个方面进行认识,首先人脑思维结构的载体是自然语言而非纯数学,人类在认识事物的过程中,喜欢运用语言文字这样的“符号”对客观事物进行定性描述,例如用“漂亮”“丑陋”“高”“矮”“胖”“瘦”等词语形容人的相貌和体格,用“炎热”“寒冷”“潮湿”“干燥”等词语形容气候,用“工作稳定”“性能可靠”等词语形容机械工作状态,而这些语汇包含了客观世界中存在的不确定性和模糊性问题。虽然,通过自然语言描述不确定性事物能够获得更大的理解空间和更强的认知能力,但是由于人与人之间的知识、阅历等主观条件的不同,对同一事物的不确定性和模糊性的认知能力就会存在差异,因此很难对同一事物的不确定性达成一致,所以迫切需要一种理论能够实现将人类大脑对事物的定性描述转化为具有特定量值的、准确的定量表达,达到对各领域复杂问题进行有效解决的目的。其次,云模型将概率论和模糊集合理论有机结合在一起,通过定性与定量转化的方式,将自然语言中概念的随机性和模糊性进行定量表达,使人类语言描述不确定事物可以在定性与定量之间相互自然转化。
6.5.2 云的基本定义
定义4(李德毅,杜鹉,2005):设定量论域的数值精确概念用U表示, C是一个属于论域U上的定性表述,如果x为某一确定量值,且满足x∈U,当x作为定性描述C的一次随机实现,则x对C的确定度μ(x)∈[0,1]为:μ:U→[0,1],∀x∈U,x→μ(x),则x在论域U上形成的分布叫作云,一个云滴对应一个x,正态云模型中的μ(x)服从正态分布。
云具有3个数值特征值,他们分别是期望Ex、熵En和超熵He,用来反映研究对象整体的定性描述,图6.14为云数字特征值示意图。
期望是用来体现定性概念在整个论域上的中心值,期望值必定包括在对应的定性概念中。熵主要表示定性概念的不确定性和模糊性,熵值越大,定性概念在论域空间中取值的范围就越大,概念的模糊性就越明显。超熵用来衡量熵的不确定性程度,超熵直接可以提现出云滴厚度和离散程度,并且云滴厚度和离散程度随着超熵的增大而增大,也表示是熵的随机性与模糊性。
图6.14 云数字特征值示意图
为了更加准确理解云模型中3个数字特征的准确含义,图6.15~图6.18显示出不同期望、熵、超熵和云滴数的云形态对比。图6.15是期望分别为10和15的云模型对比。图6.16是熵分别为2.5和5的云模型对比。图6.17是超熵取值0.1和1的云模型。图6.18是云滴数取1000和300时的云模型。
图6.15 期望值不同时云模型对比图(云滴数:1000)
图6.16 熵值不同时云模型对比图(云滴数:1000)
图6.17 超熵值不同时云模型对比图(云滴数:1000)
图6.18 云滴数不同时云模型对比图
综上所述,云模型的3个数字特征值将事物定性概念的不确定性和模糊随机性联系在一起,形成了关于定性描述与定量描述的映射模型,为知识表示夯实了基础。
6.5.3 正态云发生器
在介绍正态云发生器之前应首先引入正态云的定义。
假设某一定量论域U可用确定数值表示,C是定量论域U上的定性概念划分,如果在论域U上存在一个在定性概念C上的一次随机实现的定量值x,若x满足,其中,,则x对C的确定度满足
此时,x在论域U上的分布即为正态云。
正态云发生器有正向和逆向两种,本文主要应用正向正态云发生器,正向正态云发生器是从定性到定量的映射,具体算法如下:
输入:数字特征值期望Ex、熵En、超熵He和云滴数n。
输出:n个云滴[x,μ(x)],或用drop(xi,μi),i=1,2,…,n进行表示。
步骤:
(1)生成一个正态随机数。其中,En和分别期望和方差。
(2)生成一个正态随机数。其中,Ex和分别为期望和方差。
(3)通过式μi=计算隶属度并生成一个云滴drop(xi,μi)。
(4)重复步骤(1)~(3),直到生成n个云滴为止。
在正向正态云发生器的算法中,熵En和超熵He必须同时大于0时才能保证云模型模糊性和随机性的特征。如果超熵He为0,则云的厚度为0,x服从正态分布,云模型没有随机性;如果熵En和超熵He同时为0,此时由算法计算得到的x和μ均为1,云模型失去模糊性和随机性特征。