中文名 | 模糊优化控制 | 外文名 | Fuzzy optimization control |
---|---|---|---|
涉及学科 | 信息科学 | 利 用 | 模糊数学的基本思想和理论 |
目 的 | 使取得最大或最小值 | 应 用 | 自动控制 |
优化控制是指在给定的约束条件下,寻求一个控制系统,使给定的被控系统性能指标取得最大或最小值的控制。
随着科学技术的发展,目前智能控制已开始广泛应用。这种控制将人类的智能,例如把适应、学习、探索等能力引入控制系统,使其具有识别、决策等功能,从而使自动控制和优化控制达到了更高级的阶段。
一般说,进行优化控制必须要具备三个条件:
1、要给出系统的性能指标。
2、要给出约束条件。
3、要寻找优化控制的机制和方法。
由于在实际中情况是复杂多变的,进行优化控制不可能达到十全十美,因此优化控制只能是相对的或满意的控制,而难以做到最优控制。
1.网络化系统集成优化控制算法及其实现 网络化系统的集成优化控制方法就是将复杂系统的集成优化控制方法和网络自动化技术相结合,用来解决网络化复杂系统的优化控制问题,使其在难以建模、系统具有网络化和区域化等情况下,获得满意的优化控制结果。网络化系统集成优化控制方法的特点是引入了网络回路,在优化算法中引人了一些不确定因素,其优化控制更加依赖于网络系统和网络技术。网络化系统集成优化控制的关键技术在于动态系统优化与参数估计集成优化方法的实现和网络信息传输,借助于动态系统集成优化控制技术和网络自动化技术可实现网络化系统的集成优化控制,可以基于局域网或Intemet实现。
2.网络化系统集成优化控制的特征 对一个动态优化控制方法,除了给出优化算法,还需要对其性能进行分析,只有这样才能保证优化方法的实施。网络化系统的集成优化控制方法的性能包括实时性、最优性、收敛性及其鲁棒性等。
1).实时性 在引人网络之前,针对跨区域的复杂系统,其优化控制的实施是很困难的,即使能够,其实时性也难以保证。网络化系统集成优化控制方法由于借助于计算机网络技术来实施集成优化控制,可以较好地解决跨区域复杂系统集成优化控制的实时性问题。
2).最优性 算法最优性是指在算法收敛的情况下,收敛解是否实际系统的最优解。对于网络化系统集成优化控制方法,在最优解存在且唯一等假设条件下,若算法收敛,则收敛解满足最优性必要条件,即所得优化解是实际系统的真实最优解。
3).收敛性 网络化系统集成优化控制方法需要实施,首先要求其优化控制算法是收敛的,收敛性就是研究算法收敛的条件,针对不同的算法其收敛性条件有所不同。对于网络化系统的集成优化控制方法,其优化的框架没有改变,只是引人了网络回路,利用算法映射及压缩映射原理,通过分析可以获得保证优化算法收敛的条件。
4).鲁棒性 网络化系统集成优化控制方法的鲁棒性问题是指在存在这样那样扰动的情况下,优化算法保持其收敛性,并收敛到最优解的能力。网络化系统的集成优化控制方法在不需要实际过程的精确数学模型的情况下可以获得实际系统的真实最优解,对模型的结构和参数具有较强的鲁棒性。
网络化系统的集成优化控制方法是一种基于网络环境下的集成优化控制方法,计算机网络的信息的安全问题必然影响到系统集成优化控制的实施。因此,对网络化系统集成优化控制中的信息安全问题及其对策进行分析和研究是十分必要的,只有这样才能保证网络化系统的集成优化控制的顺利实施。网络化系统集成优化控制中的信息安全问题可以借助于计算机网络的信息安全对策予以解决。
网络化系统的集成优化控制方法为解决区域性复杂系统的优化控制提供了一种新思路,该方法具有以下优越性:
1)由于网络化系统的集成优化控制方法本质是采用动态大系统的DISOPE递阶优化方法,这样就使得网络化系统的集成优化控制在不需要复杂系统的精确数学模型的情况下,就可以获得实际系统的真实最优解;
2)网络化系统的集成优化控制方法为解决跨区域性的复杂系统的优化控制提供了一种可靠的实现途径和形式。同时由于网络自动化技术的发展和网络信息传输实时性的提高,使得实时地解决区域性的复杂系统的优化控制成为可能。
为了实现对直线电机运动的高精度控制,系统采用全闭环的控制策略,但在系统的速度环控制中,因为负载直接作用在电机而产生的扰动,如果仅采用 PID 控制,则很难满足系统的快速响应需求。由于模糊控制技术具有适用范围广、对时变负载具有一定的鲁棒性的特点,而直线电机伺服控制系统又是一种要求要具有快速响应性并能够在极短时间内实现动态调节的系统,所以本文考虑在速度环设计了PID模糊控制器,利用模糊控制器对电机的速度进行控制,并同电流环和位置环的经典控制策略一起来实现对直线电机的精确控制。
模糊控制器包括四部分:
(1)模糊化。主要作用是选定模糊控制器的输入量,并将其转换为系统可识别的模糊量,具体包含以下三步:
第一,对输入量进行满足模糊控制需求的处理;
第二,对输入量进行尺度变换;
第三,确定各输入量的模糊语言取值和相应的隶属度函数。
(2)规则库。根据人类专家的经验建立模糊规则库。模糊规则库包含众多控制规则,是从实际控制经验过渡到模糊控制器的关键步骤。
(3)模糊推理。主要实现基于知识的推理决策。
(4)解模糊。主要作用是将推理得到的控制量转化为控制输出。
檐高是指设计室外地坪至檐口滴水线的高度,有女儿墙的算至女儿墙的顶,突出主体建筑屋顶的电梯间、水箱间等不计入檐口高度之内。这是河北定额的规定
“模糊预算”是针对“综合预算”与“二级精算预算”而来的,它没有上述预算报价中的材料品牌、规格、型号,没有工艺制作说明,甚至项目以及工程量都标注得不很清楚,其报价也只能是一个大概的估算。 “模糊预算”一...
图纸上怎么才算为一跨,柱与柱,主梁与主梁,我是知道的,框架梁是为主梁,非框架梁是为次梁,这样理解对吗,但是图纸上KL与L相交时也是算成一跨的,那么跟定义有矛盾啊,还是我理解有误。二层梁配筋图里怎么会出...
利用模糊数学的基本思想和理论的控制方法。在传统的控制领域里,控制系统动态模式的精确与否是影响控制优劣的最主要关键,系统动态的信息越详细,则越能达到精确控制的目的。然而,对于复杂的系统,由于变量太多,往往难以正确的描述系统的动态,于是工程师便利用各种方法来简化系统动态,以达成控制的目的,但却不尽理想。换言之,传统的控制理论对于明确系统有强而有力的控制能力,但对于过于复杂或难以精确描述的系统,则显得无能为力了。因此便尝试着以模糊数学来处理这些控制问题。
“模糊”是人类感知万物,获取知识,思维推理,决策实施的重要特征。“模糊”比“清晰”所拥有的信息容量更大,内涵更丰富,更符合客观世界。
Zadeh创立的模糊数学,对不明确系统的控制有极大的贡献,自七十年代以后,一些实用的模糊控制器的相继出现,使得我们在控制领域中又向前迈进了一大步,下面本文将对模糊控制理论做一番浅介。
模糊逻辑控制(Fuzzy Logic Control)简称模糊控制(Fuzzy Control),是以模糊集合论、模糊语言变量和模糊逻辑推理为基础的一种计算机数字控制技术。1965年,美国的L.A.Zadeh创立了模糊集合论;1973年他给出了模糊逻辑控制的定义和相关的定理。1974年,英国的E.H.Mamdani首次根据模糊控制语句组成模糊控制器,并将它应用于锅炉和蒸汽机的控制,获得了实验室的成功。这一开拓性的工作标志着模糊控制论的诞生。
模糊控制实质上是一种非线性控制,从属于智能控制的范畴。模糊控制的一大特点是既有系统化的理论,又有大量的实际应用背景。模糊控制的发展最初在西方遇到了较大的阻力;然而在东方尤其是日本,得到了迅速而广泛的推广应用。近20多年来,模糊控制不论在理论上还是技术上都有了长足的进步,成为自动控制领域一个非常活跃而又硕果累累的分支。其典型应用涉及生产和生活的许多方面,例如在家用电器设备中有模糊洗衣机、空调、微波炉、吸尘器、照相机和摄录机等;在工业控制领域中有水净化处理、发酵过程、化学反应釜、水泥窑炉等;在专用系统和其它方面有地铁靠站停车、汽车驾驶、电梯、自动扶梯、蒸汽引擎以及机器人的模糊控制。
选择的控制变量要具有系统特性。控制变量选择是否正确,对系统的性能将有很大的影响。例如做位置控制时,系统输出与设定值的误差量就可以当做模糊控制器的输入变量。一般而言,可选用系统输出、输出变化量、输出误差、输出误差变化量及输出误差量总和等,作为模糊控制器的语言变量,具体如何选择还有赖于工程师对于系统的了解及其专业知识。因此,经验和工程知识在选择控制变量时扮演着相当重要的角色。
控制变量确定之后,接下来就是根据经验写出控制规则。在做成模糊控制规则之前,首先必需对模糊控制器的输入和输出变量空间做模糊分割。例如输入空间只有单一变量时,可以用三个或五个模糊集合对空间做模糊分割,划分成三个或五个区域。输入空间为二元变量时,采用四条模糊控制规则,可以将空间分成四个区域。
模糊分割时各领域间的重叠的程度影响控制的性能;一般而言,模集合重叠的程度并没有明确的决定方法,大都依靠模拟和实验的调整决定分割方式,不过有些报告提出大约1/3~1/2最为理想。重叠部份的大小意味着模糊控制规则间模糊的程度,因此模糊分割是模糊控制的重要特征。
控制规则是模糊控制器的核心,它的正确与否直接影响到控制器的性能,其数目的多寡也是衡量控制器性能的一个重要因素,下面对控制规则做进一步的探讨。
模糊控制规则的取得方式:
(1) 专家的经验和知识
模糊控制也称为控制系统中的[4]专家系统,专家的经验和知识在其设计上有余力的线索。人类在日常生活常中判断事情,使用语言定性分析多于数值定量分析;而模糊控制规则提供了一个描述人类的行为及决策分析的自然架构;专家的知识通常可用if….then的型式来表述。
藉由询问经验丰富的专家,获得系统的知识,并将知识改为if….then的型式,如此便可构成模糊控制规则。除此之外,为了获得最佳的系统性能,常还需要多次使用[5]试误法,以修正模糊控制规则。
(2) 操作员的操作模式
现在流行的专家系统,其想法只考虑知识的获得。专家可以巧妙地操作复杂的控制对象,但要将专家的诀窍加以逻辑化并不容易,这就需要在控制上考虑技巧的获得。许多工业系统无法以一般的控制理论做正确的控制,但是熟练的操作人员在没有数学模式下,却能够成功地控制这些系统:这启发我们记录操作员的操作模式,并将其整理为if….then的型式,可构成一组控制规则。
(3) 学习
为了改善模糊控制器的性能,必须让它有自我学习或自我组织的能力,使模糊控制器能够根据设定的目标,增加或修改模糊控制规则。
模糊控制规则的形式主要可分为二种:
(1) 状态评估模糊控制规则
状态评估(state evaluation)模糊控制规则类似人类的直觉思考,它被大多数的模糊控制器所使用,其型式如下:
Ri:if x1 is Ai1 and x2 is Ai2 …. and xn is Ain
then y is Ci
其中x1,x2,…….,xn及y为语言变量或称为模糊变量,代表系统的态变量和控制变量;Ai1,Ai2,….,Ain及Ci为语言值,代表论域中的[6]模糊集合。该形式还有另一种表示法,是将后件部改为系统状态变量的函数,其形式如下:
Ri:if x1 is Ai1 and x2 is Ai2 …. and xn is Ain
then y=f1(x1,x2,…….,xn)
(2)目标评估模糊控制规则
目标评估(object evaluation)模糊控制规则能够评估控制目标,并且预测未来控制信号,其形式如下:
Ri:if(U is Ci→(x is A1 and y is B1))then U is Ci
实际应用模糊控制时,最初的问题是控制器的设计,即如何设计模糊控制法则。到目前为止模糊控制还没能像传统的控制理论一样,借由一套发展完整的理论推导来设计。下面简单介绍一下其设计概念:
在单输入和单输出的定值控制时间响应图中,若使用状态评估模糊控制规则的形式,前件部变量为输出的误差E和在一个取样周期内E的变化量CE,后件部变量为控制器输出量U的变化量CU。则误差、误差变化量及控制输出变化量的表示为:
其中E表误差,R表设定值,Y表系统输出,U表控制输出,下标n表在时刻n时的状态。由此可知,误差变化量CE是随输出Y的斜率的符号变号,当输出上升时,CE<0, 下降时CE>0。
本文所设计的模糊控制器之输出输入关系为:
E,CE→CU
在一般控制的计算法上称为速度型,这是由于其输出为U对时间的微分,相当于速度的CU。在构造上也可采用以U为后件部变量的位置型,但前件部变量必需改用E的积分值。
由于由E与CE推论CU的构造中,CU与E的关系恰巧相当于积分关系U(t)=Ki∫E(t)dt,而CU与CE的关系相当于比例关系U(t)=KpE(t)的缘故,所以又称为Fuzzy PI控制。
设计模糊控制规则时,是在所设想对控制对象各阶段的反应,记述采取哪一种控制比较好;首先选择各阶段的特征点,记录在模糊控制规则的前件部,然后思考在该点采取的动作,记录在模糊控制规则的后件部。例如,在第一循环之a1点附近,误差为正且大,但误差变化量几乎是零,可以记为“E is PB and CE is ZO”在此点附近需要很大的控制输出,记为”CU is PB”;同样地,对于b1点、c1点、d1点等的附近,可分别得到如下的控制规则:
a1:If E is PB and CE is ZO then CU is PB
b1:If E is ZO and CE is NB then XU is NB
c1:If E is NB and CE is ZO then CU is NB
d1:If E is ZO and CE is PB then CU is PB
在第二循环之a2,b2等之附近,其E和CE的绝对值比a1,b1点中之值相对减少,所以其CU值相对地也较小,其控制规则如下:
a2:If E is PM and CE is ZO then CU is PM
b2:If E is ZO and CE is NM then CU is NM
表3.2为依上述程序所构成的13条控制规则,其中纵列为E值,横列为CE值,表中所列之值为控制输出变化量CU值。由表3.2可知规则数最多可为49条,此表只使用了其中13条控制规则,设计者可依实际需要自行加减规则之数量,如19条、31条等等(表3.3,3.4所示),以改系统之响应。
Mamdani教授最初所用的模糊变量分为连续型和离散型两种型式,因此隶属度函数的型式也可以分为连续型与离散型两种。由于语言变量及相对应隶属度函数选择的不同,将形成许多不同的模糊控制器架构;下面将对各隶属度函数的型式加以介绍:
1. 连续型隶属度函数
模糊控制器中常见的连续型隶属度函数有下列三种:
(1)吊钟形
(2)三角形
(3)梯形
在式中参数a为隶属度函数中隶属度为1时的x值,参数W为隶属度函数涵盖论域宽窄的程度。而NB,NM,NS,ZO,PS,PM,PB等是论域中模糊集合的标记,其意义如下所示:
NB=负方向大的偏差(Negative Big)
NM=负方向中的偏差(Negative Medium)
NS=负方向小的偏差(Negative Small)
ZO=近于零的偏差(Zero)
PS=正方向小的偏差(Positive Small)
PM=正方向中的偏差(Positive Medium)
PB=正方向大的偏差(Positive Big)
将模糊集合的全集合正规化为区间〔-1,1〕,在模糊控制上,使用标准化的模糊变量,其全集也常正规化,这时的正规化常数(亦称为增益常数),也是在设计模糊控制器时必须决定的重要参数。
2. 离散型隶属度函数
Mamdani教授除了使用连续型全集合之外,也使用了由13个元素所构成的离散合。由于用微处理机计算时使用整数比用〔0,1〕之间的小数更方便,模糊集合的隶属度均以整数表示,如表3.1所示。
模糊控制理论发展之初,大都采用吊钟形的隶属度函数,而近几年几乎都已改用三角形的隶属度函数,这是由于三角形隶属度函数计算比较简单,性能与吊钟形几乎没有差别。
1.模糊控制的设计尚缺乏系统性,这对复杂系统的控制是难以奏效的。难以建立一套系统的模糊控制理论,以解决模糊控制的机理、稳定性分析、系统化设计方法等一系列问题;
2.如何获得模糊规则及隶属函数即系统的设计办法,完全凭经验进行;
3.信息简单的模糊处理将导致系统的控制精度降低和动态品质变差。若要提高精度就必然增加量化级数,导致规则搜索范围扩大,降低决策速度,甚至不能进行实时控制;
4.如何保证模糊控制系统的稳定性即如何解决模糊控制中关于稳定性和鲁棒性问题还有待解决。2100433B
介绍了制冷机组变负荷运行控制方法的研究进展。设计了制冷机组的模糊控制器,在变负荷运行工况下进行了实验,模糊控制器具有良好的控制效果,部分负荷下制冷机组的制冷性能系数有所提高。
以恒温空调系统为控制对象,对神经模糊控制器、常规模糊控制器和PID控制器进行了数字仿真,并用单纯形法对控制比例因子进行了参数寻优,获得了最优参数和动态响应曲线;通过对神经模糊控制器的优化学习,大大提高了神经模糊控制器的控制精度和稳定性,其性能优于最优化的PID控制器和最优化的常规模糊控制器,能有效地满足温度控制要求,并具有较好的鲁棒性;由于神经模糊控制器具有模糊控制和神经网络的智能,经过优化学习后,它具有良好的控制性能和自适应能力。
模糊稳健优化设计是指在一般模糊优化设计的基础上,计入设计变量和噪声的波动对模糊约束条件稳健性影响的模糊优化设计寻优思想本文。
"模糊稳健优化设计" 英文对照
firm fuzzy optimal design; fuzzy robust optimum design;
"模糊稳健优化设计" 在学术文献中的解释
在一般模糊优化设计的基础上,计入设计变量和噪声的波动对模糊约束条件稳健性的影响,这种模糊优化设计寻优思想本文称为模糊稳健优化设计。应用前述模糊约束条件稳健性控制准则,建立的模型就称为模糊稳健优化设计数学模型。2100433B
随着模糊控制在工业过程中的广泛应用,模糊控制规则的优化和简化越来越受到人们的重视。最初,模糊控制规则是由专家确定的,但由于高维模糊控制器会遇到"规则爆炸"的问题,即传统模糊控制器规则数量一般随输入变量的个数呈指数增长关系。对此作了重新定义,将之称为参数效率问题。并总结了解决此问题的几种方式:①规则去除方式;②分层递阶模糊系统结构方式;③并规则结构方式;④智能算法优化。
用智能算法优化解决"规则爆炸"问题的主要思想是:用一种智能优化算法对于已经定义的完备的控制规则进行抽取和过滤,将抽取的控制规则应用于控制实际的系统,同时把实际系统的性能指标作为抽取的控制规则的性能指标反馈到智能算法中,算法根据这个反馈信息进行下一次的抽取,循环进行这个过程,直到算法收敛。
利用遗传算法对已有的完备的模糊控制规则进行了过滤,取得较好的控制效果。这说明在已有的控制规则表中存在着大量的冗余的和对控制效果影响较小的信息,这些信息浪费了计算机的存储资源,影响了推理的速度和控制的实时性,有必要对这些信息进行过滤。但应用遗传算法过滤规则首先要把规则表进行编码(二进制编码或者实数编码),把编码后的规则表看成单个染色体,再对染色体群体进行选择,交叉,变异等操作,最后算法收敛后,得到针对已定义的性能指标的最优的规则表染色体。这种在编码基础上的操作,只有解码后才会知道将产生什么样的规则表,所以算法本身的机制不利于在产生规则表的过程中加入对规则表的约束条件。这种方法的结果有可能出现规则表不连续的情况,使得优化出的模糊控制规则表只能保证在特定的性能指标(如固定初始条件时系统的性能指标)意义下的最优或者可行,却并不具有鲁棒性,即在系统不同的初始条件下,控制效果差别很大。
为了解决上述问题,本文将模糊控制规则表的抽取和过滤表示为一个典型的离散组合优化问题(TSP),并利用蚁群算法在解决离散的组合优化问题中的强大优势对模糊控制规则表进行抽取。但是抽取模糊控制规则表的问题与TSP问题虽然具有相似性,但却并不完全一样,需要对蚁群算法进行改造:
1)用蚁群算法解决模糊控制规则的抽取不能定义类似TSP问题中的启发式信息(在TSP问题中是城市之间距离的倒数),因此在算法中没有应用启发式信息,在进行规则选择的过程仅利用了信息素浓度作为指导性原则。
2)为了防止产生的模糊控制规则表不连续,为每一个规则定义了一个窗口邻域,在抽取规则的过程中保证每一规则的邻域内至少被选中一条规则。我们称这样的蚁群算法为带有窗口的蚁群算法。
3)所定义的性能指标综合考虑了跟踪误差和响应时间的因素。应用此算法优化后的FUZZY-PD控制器控制小车倒摆取得了较好的控制效果:我们分别在改变初始条件和给小车加入扰动的情况下对抽取的控制规则表进行了仿真,都取得了较好的控制效果,说明这样抽取模糊控制规则表具有较好的鲁棒性。
1.蚁群算法基本思想
蚁群算法最初是由Dorigo等人提出,是一种求解组合优化问题的新型通用启发式方法。主要是受到蚁群搜索食物的过程的启发。通过对蚁群行为的研究,人们发现虽然其单个昆虫的行为非常简单,但由单个简单的个体所组成的群体却表现出极其复杂的行为;原因是蚂蚁个体之间通过一种称之为外激素的物质进行信息传递;蚂蚁在运动过程中,能够在它所经过的路径上留下该种物质,而且蚂蚁在运动过程中能够感知这种物质,并以此指导自己的运动方向。因此,由大量蚂蚁组成的蚁群的集体行为便表现出一种信息正反馈现象:某一路径上走过的蚂蚁越多,则后来者选择该路径的概率就越大。蚂蚁个体之间就是通过这种信息的交流达到搜索食物的目的。
2.用蚁群算法抽取模糊控制规则
首先将模糊控制规则问题描述为一个离散的组合优化问题,我们所要作的工作实际上是从已有的完备的控制规则(49条规则)中抽取固定数目的不完备控制规则(本文中25条规则),同时达到较好的控制效果。和TSP问题相对应,就是从49个"城市"按照性能指标最优的方式选出25个"城市",但是和TSP问题不同的是,我们只是抽取"城市",而抽取出的"城市"并不构成闭环。所以我们可以在解决问题的过程中把问题简单的表示为简化了的TSP问题。将应用于TSP问题的蚁群算法进行改造,使之能够与模糊控制规则的优选相结合。首先将规则表进行编号,并定义规则的邻域窗口。本文采用7×7的规则表,表中第一行的规则编号为1到7,第二行为8到14,以此类推,一共n=49条规则,第i条规则对应着规则表第(i-1)%7 1行,(i-1)/7 1列,%为取余操作,/为整除操作。定义规则之间的距离,设规则A在规则表中位于第i行,第j列,规则B在规则表中位于第i1行,第j1列,则规则A和规则B之间的距离为(i-i1) (j-j1),定义每一条规则周围的规则为距离它本身小于2的规则,每一条规则有一个窗口存储这些离它最近的规则。
在程序运行开始,先将蚁群随机分布于规则表上。在迭代过程中,蚂蚁每次从这n个规则中按每条规则的选取概率选取下1条规则。每只蚂蚁选中的规则列入该只蚂蚁的规则禁忌表中,在以后的选取中不再考虑。直到每只蚂蚁都选出l(l为指定的预选规则数,l
表3规则表事例
1
2
3
4
5
6
7
1
-3
100
-3
-3
100
-1
100
2
-3
-3
-3
100
-1
0
100
3
100
100
100
100
0
100
100
4
100
-2
-1
0
100
100
3
5
-2
-1
100
1
100
3
100
6
-1
0
100
2
100
3
3
7
0
100
100
100
3
100
100
其中100表示所对应得规则没有选中。
当一次循环完成后,从所有蚂蚁形成的规划方案中选择具有最小目标函数值的规划方案,并与当前保存的最优方案进行比较。如果新方案比当前保存的最优方案进行比较。如果新方案比当前保存的最优方案还要好,那么用新方案代替当前保存的方案;否则维持当前的最优方案。重复上述过程直至达到最大迭代次数。
从上述的用蚁群算法优化控制规则表的操作过程可以看出,在形成一个可行解(即一个规则表)的过程中,蚂蚁是一条规则接着一条规则的选取,直到选出一个规则集合,构成一个规则表,这和遗传算法将规则表编码后看成一个染色体操作显然是不同的,这样操作有利于在形成规则表的过程中逐一的审视构成规则表的每一条规则,这就给对规则引入约束条件提供了可操作性。在本文中,为了避免产生的控制规则不连续,加入的约束条件为每一条规则的邻域窗口内至少有一条规则被选中。
为模拟实际蚂蚁的行为,首先引进如下记号:设m是蚁群中蚂蚁的数量,τ j(t)表示t时刻在j规则节点上残留的信息量.初始时刻,各条规则上信息量相等,设τ j(0)=C(C为常数)。蚂蚁k(k=1,2,...,m)在运动过程中,根据各条规则节点上的信息量决定转移方向,p j(t)表示在t时刻蚂蚁k由当前位置转移到位置j值得注意的是本文中的蚁群算法和传统的应用于TSP问题的蚁群算法不同的是:并没有定义启发式信息(在TSP问题中为城市间距离的倒数)。原因是,对于文中的问题不存在这样的启发式信息。在文献[7]中提到,由于信息激素在算法的开始时设为同等强度的随机值,在算法开始阶段,信息激素并不能很好的指导蚂蚁找到好的初始解,也可能找到非常坏的解,这样对算法就产生了错误的收敛导向,而启发式信息的主要作用正是在算法开始阶段导引蚂蚁向好的解上留下信息素。所以当算法加入了局部搜索的机制时,认为启发式信息没有必要也是合理的。这样既提高了计算的速度(在TSP问题中,启发式信息在城市间的转移概率中是乘积运算),又为蚁群算法应用在不能或者不易定义启发式信息的问题上提供了理论依据。在本文的问题中,启发式信息是不必要的。原因有二,一是本文的问题没法定义启发式信息,二是本文中定义的约束条件可以认为是一种局部搜索机制(保证规则表连续的局部搜索机制),定义启发式信息并不是十分必要的。
随着机器人技术的迅猛发展,机器人承担的任务更加复杂多样,传统的检测手段往往面临着检测范围的局限性和检测手段的单一性.视觉伺服控制利用视觉信息作为反馈,对环境进行非接触式的测量,具有更大的信息量,提高了机器人系统的灵活性和精确性,在机器人控制中具有不可替代的作用.
视觉伺服控制系统是指使用视觉反馈的控制系统,其控制目标是将任务函数 e( s¡s( m( t) ;a))调节到最小,其中 s;s分别为系统的当前状态和期望状态.与常规控制不同的是, s基于图像信息 m( t)和系统参数 a构造,比传统的传感器信息具有更高的维度和更大的信息量,提高了机器人系统的灵活性.
视觉伺服系统通常由视觉系统、控制策略和机器人系统组成,其中视觉系统通过图像获取和视觉处理得到合适的视觉反馈信息,再由控制器得到机器人的控制输入.在应用中,需要根据任务需求设计视觉伺服系统的实现策略.从这三个方面对视觉伺服中存在的主要问题和研究进展进行综述.
视觉伺服控制涉及计算机视觉、机器人技术和控制理论等多个领域,国内外学者在过去20余年中进行了广泛的研究.Hutchinson等的三篇经典论文对视觉伺服控制的研究起到了引导作用.近年来,Staniak等和Azizian等分别对视觉伺服系统的结构及其在医疗机器人中的应用进行了综述.在国内的研究中,林靖等、赵清杰等、薛定宇等、王麟琨等、方勇纯分别对视觉伺服控制进行了综述,总结了经典的视觉伺服控制方法.
随着计算机视觉和机器人技术的飞速发展,视觉伺服控制的研究也有了显著的进步.相比于以往的综述,本文重点分析了视觉伺服系统设计中存在的主要问题及相应的解决方案.如图1所示,设计视觉伺服系统时主要需要考虑视觉系统、控制策略以及实现策略三个方面.在视觉系统方面,本文首先介绍了视觉系统的构造方法,并对动态性能的提升和噪声的处理进行了讨论.在控制策略方面,主要针对视觉伺服系统中模型不确定性和约束的处理进行了分析.另外,考虑到视觉伺服系统的可实现性和灵活性,文中对系统的实现策略进行了总结.最后,基于当前的研究进展,对未来的研究方向进行了展望.
首先介绍视觉系统的组成,然后对视觉系统动态性能的优化和噪声的处理方法进行分析和总结.
1.1视觉系统的组成
视觉系统由图像获取和视觉处理两部分组成,图像的获取是利用相机模型将三维空间投影到二维图像空间的过程,而视觉处理则是利用获取的图像信息得到视觉反馈的过程.
1.1.1相机模型
基本的相机模型主要包括针孔模型和球面投影模型,统一化模型是对球面模型的推广,将各种相机的图像映射到归一化的球面上.此处需要强调的是针孔模型的\相机撤退"问题和球面模型的旋转不变性.针孔模型的\相机撤退"问题是指当旋转误差较大时,要使特征点在图像中沿直线运动到目标,相机会先旋转着远离目标,再旋转着接近目标,在工作空间的路径是曲折的.对此可以使用极坐标系或圆柱坐标系来处理.球面模型的旋转不变性是指球的旋转对物体在球面上投影的形状是没有影响的,一方面可以避免\相机撤退"问题,同时也方便设计平移和旋转解耦的误差向量.统一化模型的吸引力在于可以将各种相机的图像映射到统一的模型,从而在设计控制器时不需要考虑具体的相机模型,增强了系统的可扩展性.另外也可以将常规的机器人传感器映射到球面,如重力向量、磁场向量或角速度等,从而可以设计多传感器信息融合的机器人控制器.
1.1.2视觉反馈
视觉伺服中的视觉反馈主要有基于位置、图像特征和多视图几何的方法.其中,基于位置的方法将视觉系统动态隐含在了目标识别和定位中,从而简化了控制器的设计,但是一般需要已知目标物体的模型,且对图像噪声和相机标定误差较为敏感.目标识别和跟踪可以参考相关综述,下文中主要介绍基于图像特征和多视图几何的方法.
1)基于图像特征的视觉反馈
常用的基于图像特征的视觉反馈构造方法,其中基于特征点的方法在以往的视觉伺服中应用较为广泛,研究较为成熟,但是容易受到图像噪声和物体遮挡的影响,并且现有的特征提取方法在发生尺度和旋转变化时的重复性和精度都不是太好,在实际应用中存在较大的问题.因此,学者们提出了基于全局图像特征的视觉反馈方法,利用更多的图像信息对任务进行描述,从而增强视觉系统的鲁棒性,但是模型较为复杂,控制器的设计较为困难,且可能陷入局部极小点.目前针对这一类系统的控制器设计的研究还比较少,一般利用局部线性化模型进行控制,只能保证局部的稳定性.
2)基于多视图几何的视觉反馈
多视图几何描述了物体多幅图像之间的关系,间接反映了相机之间的几何关系.相比于基于图像特征的方法,多视图几何与笛卡尔空间的关系较为直接,简化了控制器的设计.常用的多视图几何包括单应性、对极几何以及三焦张量需要强调的是,两个视图之间的极点与相对姿态不是同构的,当极点为零时不能保证二者姿态一致,而只能保证二者共线,一般使用两步法补偿距离误差.单应性矩阵描述了共面特征点在两个视图之间的变换关系,可以唯一决定二者的相对姿态.对于非平面物体,可以结合对极几何的方法进行处理.结合单应性矩阵和极点构造了在平衡点附近与姿态同构的误差系统.中采用类似的思路,并利用图像配准的思想对几何参数进行估计.但是,由于模型复杂,文献中只提出了局部稳定的控制律.相比之下,三焦张量是一种更加通用的方法,对目标形状没有要求,且不存在奇异性问题.目前基于对极几何和三焦张量的方法还主要用于平面移动机器人的控制,在六自由度控制中的应用有待进一步研究.
1.2视觉系统动态性能的提升
相比于常规的机器人传感器,视觉系统的采样频率较低,视觉处理算法的时间延迟较大,而且具有一定的噪声,这对视觉伺服系统的动态性能有很大的影响.近年来的研究主要从以下三个方面进行改进:采用高速视觉系统,提高处理速度和采样频率;使用分布式的网络化架构,提高算法的执行效率;设计观测器,处理视觉反馈中的噪声和延迟问题.
1)高速视觉系统
常用的数字相机的采样频率较低,一般在30fps左右.为了适应高速视觉伺服任务的需求,近年来研究者开发出各种高速视觉系统.高速视觉系统一般采用并行的结构,图像检测和处理都是以高速进行,从而可以达到高于1kHz的频率,方便进行高速运动物体的跟踪和柔性物体的识别,常用于快速反应的系统,但是受到硬件设备的限制,图像分辨率较低,物体表面纹理不清晰,难以描述复杂的场景,且系统较为复杂,开发和维护的成本高.对于这一类的系统,可以使用图像矩、核采样、互信息等全局图像特征,不需要特征点的提取,对图像分辨率的要求较低,相比之下控制精度更高.
2)分布式网络化的视觉系统
文献中提出基于网络化分布式计算的视觉伺服控制系统,从分布在不同部位的传感器(如视觉传感器、光学传感器、雷达等)采集的数据通过网络传送到处理器节点进行处理,从而提高了视觉伺服系统的采样速度.文献中提出了视觉伺服系统中图像数据的传输协议及其调度策略.分布式的实现策略充分利用了多个网络节点的计算资源,从而更快地进行多传感器信息融合,但是其效率很大程度上依赖于网络的速度,并且网络化的系统增加了控制算法的复杂程度,特别是针对网络延时、故障的处理.
3)结合观测器的视觉系统
由于视觉设备的采样频率低,并且具有噪声,因此可以利用观测器对图像特征进行观测,从而应对噪声和延迟对系统的影响.在硬件条件限制下,使用观测器是最有效的改善视觉系统性能的方法.
卡尔曼滤波(Kalman¯lter)是一种常用的方法,对于视觉伺服系统这种非线性对象,可以使用扩展卡尔曼滤波器.当噪声特征未知时,可以使用自适应或自整定的方法.另外,由于视觉系统处理时间较长,因此可能出现测量时间长于控制周期的情况,可以使用双速率卡尔曼滤波的方法对系统状态进行观测.
粒子滤波(Particle¯lter[55])可以用于非高斯噪声下的非线性系统,相比于卡尔曼滤波的方法更加适合于视觉伺服系统的应用.其基本思想是通过随机采样获取概率分布,基于这些观测值,实际的概率分布可以通过调整采样的权重和位置得到.
虚拟视觉伺服(Virtualvisualservo[56])以重投影误差作为任务函数,设计虚拟控制律使其最小化,再将此控制律中得到的控制输入(速度、加速度)进行积分从而得到观测到的相机位置和速度,省去了目标识别、定位等耗时的过程.
1.3视觉系统噪声的处理
视觉系统的噪声主要来自于相机感光元件的噪声和视觉处理算法的误差,对控制系统性能有较大影响.视觉系统噪声的处理可以从以下4个方面入手:
1)设计鲁棒的特征提取算法图像噪声对图像特征的提取影响较大,尤其是基于像素梯度的局部图像特征,会出现特征点的误提取和误匹配,直接导致系统状态变量的误差,对控制系统的稳定性有很大的影响.常用的去除例外点的方法有RANSAC(Randomsampleconsensus)算法、霍夫变换、最小二乘法以及M-estimators算法等.
2)使用观测器降低噪声的影响对于含有噪声的特征向量,可以利用观测器对其状态进行观测降低噪声的影响.常用的方法有Kalman滤波[52¡54]、粒子滤波[55]等.另外,在有些控制器中需要利用图像空间中的速度信息,由于图像采样频率较低且噪声较大,数值微分的方法存在较大的误差,此时也可以利用观测器对其进行估计
3)利用冗余的特征向量对于冗余的特征向量,可以利用每个特征点测量的统计特征描述该特征点的可靠性,在设计控制律时可以基于每个维度的可靠性设计加权矩阵,从而降低噪声较大或误匹配特征点对系统的影响.另外,也可以引入随特征点与图像边界距离递增的加权函数处理目标部分离开视野的情况,保证控制律的连续性,提高系统的容错性.
4)提高对目标的感知力图像对物体运动的感知力与特征点的选取以及物体姿态有关,当存在图像噪声时,不同的特征点选取对系统稳态误差有一定的影响,因此可以利用优化的方法选取最佳的特征点对任务进行描述[59].在控制的过程中,可以利用图像雅可比矩阵的奇异值衡量对目标的感知能力.在任务零空间中优化轨迹以增强感知力,从而提高控制性能.
在视觉伺服控制器的设计中,主要的问题在于模型不确定性和约束的处理.这是由于视觉模型依赖于目标深度、相机参数等未知或不精确的信息,并且在控制的过程中需要保证目标的可见,对系统的稳定性和动态性能有较大的影响.
2.1视觉伺服中模型不确定性的处理
针对模型不确定性问题,主要有三种解决方案,分别为自适应算法、鲁棒算法和智能算法.自适应算法通过自适应环节在线调整模型,从而优化控制性能;鲁棒算法基于最优估计参数设计控制器,并保证对一定范围内参数摄动的稳定性;智能算法一般基于学习的策略应对参数不确定性.
2.1.1自适应视觉伺服控制
考虑到模型参数不确定带来的问题,研究者提出了一系列自适应的方法对模型误差进行补偿.自适应控制方法由控制律和自适应环节组成,通过自适应环节的在线修正保证系统的稳定性.自适应的方法可以分为参数自适应和雅可比矩阵自适应方法.
1)参数自适应算法
由于特征点在图像空间的运动特性依赖于其深度和相机参数,从而可以在控制过程中根据控制输入使用当前估计参数将运动投影到图像空间,预测特征点的运动.预测值与实际观测的特征点运动之间的差异作为估计投影误差,可以通过迭代优化的方法使该投影误差最小化从而对参数进行在线估计.一种常用的自适应方法是结合Slotine等的思想,利用梯度法或其他搜索方法对特征点的估计投影误差进行在线最小化.
当相机标定参数未知时,一种思路是基于\深度无关雅可比矩阵"的方法,将图像雅可比矩阵分为深度因子和深度无关的部分,使用深度无关的部分设计反馈控制律,从而在得到的闭环系统中相机参数是线性表达的.对于深度信息未知的情况,可以加入对深度的自适应环节增强其稳定性.除了基于特征点的系统,这种方法对一些广义特征也是有效的,只要深度无关雅可比矩阵对广义特征的未知几何参数是线性参数化的,如距离、角度、质心等.
对于视觉伺服轨迹跟踪控制,常规的方法需要加入图像空间中的速度作为前馈项,而图像中的速度一般是通过对图像坐标信息的数值微分得到的,相比于关节空间的速度具有更大的噪声,尤其是当采样频率较低时具有较大的误差.因此,一些学者提出不需要测量图像速度的方法.这一类方法利用关节速度和估计的雅可比矩阵设计图像空间速度的观测器,并加入对相机参数和深度的自适应.因为机器人关节速度的测量是比较精确的,因此可以较好地改善数值微分带来的问题.
2)雅可比矩阵自适应算法
这一类的方法直接对雅可比矩阵进行在线辨识,由递推的雅可比矩阵辨识算法和控制律组成.常用的雅可比矩阵辨识方法如Broyden算法、加权递推最小二乘算法、Kalman滤波等.Pari等通过实验对比了使用递推最小二乘法估计的雅可比矩阵和使用解析形式的雅可比矩阵时的控制性能,结果证明基于雅可比矩阵在线辨识的方法具有与基于解析形式雅可比矩阵的方法相差不多的控制效果和鲁棒性,而基于雅可比矩阵在线辨识的方法不需要大量对系统的先验知识和复杂的模型推导过程,但是其模型只在其训练的区域内有效.
2.1.2鲁棒视觉伺服控制
在基于图像的视觉伺服控制中,由相机参数、目标深度以及机器人模型误差造成的图像雅可比矩阵的不确定性会对控制效果产生影响,并可能造成控制器不稳定.为了保证在参数摄动的情况下的控制器的稳定性,可以在最优参数估计的基础上设计鲁棒控制器,从而在一定的参数变化域内保证稳定性.
一种常用的思路是利用李雅普诺夫的方法设计鲁棒控制器,从而克服深度和标定误差、机器人模型误差以及机器人执行速度指令时的量化误差带来的不确定性问题.另一种思路是基于优化的方法,通过对性能指标的在线优化(如 H2 =H1指标、闭环系统的稳定域等)得到在具有参数不确定性时的最优控制输入.另外,滑模控制也是一种常用的方法,通过构造与系统不确定性参数和扰动无关的滑动面,并设计控制律迫使系统向超平面收束,从而沿着切换超平面到达系统原点.由于常规的滑模控制产生的控制输入是不连续的,可能造成系统的抖振,可以使用二阶滑模Super-twisting控制的方法解决此问题.
虽然基于鲁棒控制的方法一般都具有对参数变化和扰动不敏感的优点,但是通常需要较大的控制增益,造成系统响应不光滑,使执行器的损耗较大,且可能造成系统的抖振.在未来的研究中可以结合自适应控制的方法,在模型细小变化时利用控制器的鲁棒性从而避免自适应机构过于频繁的调整,当模型变化较大时,则利用自适应的方法对其进行修正,从而避免鲁棒控制方法过高的增益造成的问题.
2.1.3智能视觉伺服控制
智能控制不需要精确的数学模型,并且具有自学习能力,适合于具有模型不确定性的视觉伺服系统控制.智能视觉伺服控制方法有:
基于计算智能的方法一般利用人工神经网络、遗传算法等方法对视觉伺服系统模型进行拟合,并利用学习到的模型进行控制.BP神经网络是一种常用的方法,为了提高其收敛速度,可以使用遗传算法设计其初值和参数.这一类方法不需要复杂的建模过程,但是需要预先进行离线训练,而且当环境变化时又需要重新训练,限制了其应用.
模糊控制利用模糊规则描述视觉伺服系统中各变量之间的关系,不需要精确的系统模型,但是需要一定的先验知识或离线学习.在应用中,可以直接设计模糊控制器或利用模糊规则对其他控制器参数进行更新.但是,对于多自由度的视觉伺服系统,变量之间的关系复杂且耦合严重,模糊规则的设计困难,因此以往的研究主要针对低自由度的系统.对于具有重复特性的视觉伺服任务,迭代学习控制利用先前动作中的数据信息,通过迭代找到合适的控制输入,可以实现精确的轨迹跟踪.这一类方法主要有两种思路,一种是直接迭代学习控制,使用迭代学习律得到控制输入的前馈量,并可以加入反馈辅助项提高收敛速度;另一种是间接迭代学习控制,使用迭代学习对模型参数进行更新,从而最终得到精确的模型用于跟踪控制.这一类方法要求任务具有重复特性,可以用于工业现场的流水线作业.
近20多年来,机器人视觉伺服控制得到了广泛的研究,但是在实际中的应用较少.实际上,视觉伺服的理论研究与实际应用有一定的脱节,大部分的研究考虑理想的工作环境和任务,并采用示教(Teach-by-showing)的方式.这适合于静态环境下的重复性任务,但是机器人的任务是复杂多样的.近年来,研究者提出了创新性的解决方案,为视觉伺服系统的实施和应用提供了新的思路.在实际中,基于视觉伺服的系统主要有两种类型,一种是机器人自主控制系统,完全由机器人自身根据视觉反馈完成分配的任务;另一种是人机协作系统,在任务完成的过程中需要人为的干预,其目的在于协助人更好地完成任务.
3.1自主控制系统
视觉伺服在机器人系统中有广泛的应用,如移动机器人的视觉导航和机械臂的末端控制等.移动机器人的视觉导航可以描述为视觉伺服跟踪控制问题或一系列的视觉伺服调节控制问题,一般需要预先进行训练得到期望的图像序列.工业机械臂常使用示教的策略,以零件组装任务为例,工程师需要先利用手操器对其进行编程,机械臂再通过执行记录的驱动信号完成任务.引入视觉伺服系统可以简化此过程,只需要人在相机的监控下完成一次操作,机械臂即可利用视觉反馈完成任务.传统的视觉伺服系统使用示教的方式,其控制器的设定值为相机在期望位置处拍摄到的图像.这种方法适合于在局部空间内执行重复性任务的工业机械臂,但是对于大范围的移动机器人视觉导航任务显得实现成本较高.学者们提出了以下几种改进策略:
1)利用其他相机拍摄的图像作为设定值,如Teach-by-zooming策略;
2)利用其他模态的图像作为设定值,如基于互信息的方法;
3)利用几何信息定义视觉伺服任务.
在现实生活中,如果要告诉某人去某地,可以提供该地点的照片或地图,也可以描述该场景的几何特性.实际上,上述的三种策略分别对应了人类的这些行为习惯.在未来的机器人应用中,可以充分利用互联网资源,如Google街景、Google地图等,使其更灵活地为人类服务.
另外,大部分视觉伺服系统都要求目标在图像中持续可见(FOV约束),这在实际任务中大大缩小了机器人的可达工作空间.Jia等针对平面移动机器人提出了基于稀疏路标的视觉导航方法,利用\关键帧"策略放松了视野约束,从而优化了非完整约束机器人在工作空间中的轨迹.Li等提出了机器人任务空间的全局控制器,利用各个区域性有效的反馈信息构造了连续的整体控制器,使得机器人在完成任务的过程中可以安全地穿过视觉感知盲区和奇异区域.
3.2人机协作系统
目前大部分机器人的自主定位和导航任务都需要预先对任务进行精确描述,但是实际应用中的一些复杂任务难以用数学描述,且在任务完成的过程中需要进行智能决策,以当前的人工智能发展程度无法由机器人自主完成.因此可以构造人机协作系统,在任务执行过程中加入人类的判断,视觉伺服控制作为辅助系统,帮助人更轻松地完成一些复杂任务,形成半自动的系统.常见的人机协作系统有以下几种实现策略:
1)人机串级控制,人负责上层的决策控制,视觉伺服系统负责底层的运动控制,如水下遥控机器人、半自动驾驶轮椅等.
2)视觉伺服系统对操作对象施加运动约束,降低人需要操作的自由度,提高操作精度,如人机协作操作、手术辅助系统等.
3)人机切换控制,将任务分为人主导的区域和机器人主导的区域,共同完成任务.
在医疗领域,学者们提出了一系列基于医疗成像设备的视觉伺服系统,对医生的手术操作起到协助作用.
模糊控制理论发展至今,模糊推论的方法大致可分为三种,第一种推论法是依据模糊关系的合成法则,第二种推论法是根据模糊逻辑的推论法简化而成,第三种推论法和第一种相类似,只是其后件部分改由一般的线性式组成的。模糊推论大都采三段论法,可表示如下:
条件命题:If x is A then y is B
事 实:x is A
结 论:y is B
表示法中的条件命题相当于模糊控制中的模糊控制规则,前件部和后件部的关系,可以用模糊关系式来表达;至于推论演算,则是将模糊关系和模糊集合A进行合成演算,得到模糊集合B。
若前件部分含有多个命题时,则可表示如下:
条件命题:If x1 is A1 …. and xn is An
then y is B
事 实:x is A1 and ….and xn is A’n
结 论:y is B