1.2 模糊逻辑与进化计算的“强强联合”
1.2.1 研究进展简述
抠图是一种通过估计前景不透明度来实现精确提取前景的图像、视频处理技术,在图像合成、视频后期制作、虚拟现实等许多领域拥有着广阔的应用前景。在抠图问题中,像素对直接决定了未知像素的透明度,像素对选择是抠图的核心问题。基于启发式优化的抠图技术提供了一个实现像素对优化问题全局搜索的可行的解决方案。在该技术中,像素对选择是核心环节,其主要包括像素对评价与像素对优化两个部分,所面临的优化精度较低的问题也主要反映在这两个部分。
像素对评价的目标是准确地定量度量像素对的质量。高质量的像素对对应的未知像素透明度值接近于标准抠图透明度遮罩中的对应值。像素对评价的难点在于评价过程中标准的抠图透明度遮罩是未知的,像素对评价需要对前景物体的形状、颜色、光照、场景等变化鲁棒。研究人员已经提出了低颜色失真[2]、空间距离相近[3]、纹理相似[5]等多种像素对评价准则。最近的像素对评价方法采用多个评价准则来提高评价的准确性。这些评价方法的评价函数往往包含多个评价项,每个项对应一个评价准则。多个评价准则项采用线性加权的方式[3,17]或简单的非线性组合的方式(例如,将多个评价项相乘)[5-7]构建像素对评价函数。评价方法存在一个潜在的假设:多个像素对评价准则可以同时被满足。然而,在复杂的情况下该假设不一定能成立。例如,在最优的前景像素靠近未知像素、最优的背景像素远离未知像素的情况下,虽然前景像素满足空间距离相近评价准则,最优的背景像素却难以满足该准则。由于评价准则满足程度的不确定性,在该情况下现有的评价方法往往不能提供准确的评价。目前的评价方法依然不能处理多准则满足程度的不确定性。
像素对优化是像素对选择中的一个挑战。一方面由于待优化的目标函数包含多个满足程度不确定的评价准则,像素对优化问题是一个复杂的组合优化问题,另一方面该问题搜索空间巨大且涉及的决策变量数量大,使得像素对优化的难度陡增。现有的研究通过采样的方式对搜索空间进行缩减,实现对像素对优化问题的近似求解[2-3,6-7,15]。虽然经采样后优化问题的搜索空间大幅减少,基于采样的抠图算法具有计算复杂度较低的优点,但是这类算法的主要缺点在于由于抠图场景、光照等因素的改变,其不可避免地存在丢失最优样本的问题。为了解决该问题,最近的研究将像素对优化问题建模为大规模连续优化问题,通过大规模启发式优化技术实现了免采样的像素对全局搜索。由于这类算法不需要采样,因此,其在理论上完全避免了丢失最优样本的问题,现有的基于启发式优化的免采样抠图算法直接对包含多个评价项组合而成的像素对评价函数进行优化。由于每个评价项的启发式信息在组成目标函数的过程中被隐去,现有的算法在优化过程中未能充分利用每个评价项所提供的启发式信息,单个评价项所提供的启发式信息往往能引导启发式优化算法跳出局部最优解,逼近全局最优解。图1-7给出了一个例子。在该例子中三个评价项组成了复杂的多准则的评价函数,合成后的多准则的评价函数缺少足够的启发式信息,难以跳出局部最优解。评价项2所提供的启发式信息,可引导启发式优化算法从局部最优解向全局最优解逼近。目前鲜有将单目标优化问题多目标化的研究,即将多准则单目标优化问题转化为多目标优化问题进行求解。Knowles等人[18]提出了两个将单目标优化问题多目标化的途径:额外设计一个与原问题搜索空间相同的优化目标;通过将决策变量分组的方式将原优化问题分解成多个子优化问题。Greiner等人[19]受到Knowles等人的工作启发,为框架结构的优化问题设计了一个辅助优化目标。考虑到高质量像素对特征的不确定性,能提供丰富的启发式信息的辅助优化目标设计难度很大,设计辅助优化目标的途径并不适合多评价准则的像素对优化问题。虽然基于分组的多目标化方法可以减少优化问题的复杂度,但是这种方法依然未能充分利用单个评价项的启发式信息。
图1-7 多准则评价函数中单个评价项提供启发式信息引导启发式优化算法跳出局部最优解逼近全局最优解的例子(见彩插)