对偶控制理论

科技工作者之家 2020-11-17

对偶控制理论(dual control theory)是控制理论的一个分支,常用在控制初始特性不明的系统。

定义对偶控制系统有以下二个目的:

动作:依现有的资讯,尽可能的控制此系统。

调试:以此系统进行测试,以了解此系统,并设法在未来可以控制的更好。

这二个目的有时会互相冲突。

对偶控制理论是Alexander Aronovich Fel'dbaum在1960年代发展的。他证明了可以用动态规划找到最佳控制法则,但在实际上是不可行的。因此发展了许多设计亚最佳(Suboptimal)对偶控制器的方法。1

历史40年前 ,对于参数未知的随机系统,前苏联学者Feldbaum提出了对偶控制,其本质就是控制器,一方面要控制系统使其输出趋向期望的目标;另一方面,还要对系统进行学习以减少系统中参数的不确定性 ,两者之间存在耦合,不能分开进行 ,这种耦合导致了最优控制的解析解无法获得。

2000年,IEEE Control Magazine把对偶控制列为上世纪对控制理论有重大影响的 25个问题之一,至今没有解决。

2002年,李端教授等人对于参数的不确定性仅存在于测量方程 ,提出了方差最小化方法,获得了具有主动学习特点的对偶控制律,同年,他们还用方差最小化和度量系统参数不确定性熵的方法给出了参数不确定性存在于状态方程与测量方程的对偶控制律。1

例子以汽车来举例,若有人要开一部新车,希望可以又便宜又平顺的到达目的地,但又想知道汽车的加速性能、方向盘及刹车的情形,以便知道如何驾驶这部车,这情形下会依此目的有一些测试性的驾驶行为。同様的,对偶控制会在系统中加入所谓探测性的信号,可能会影响短期的特性,但收集到的资料可能会对长期的特性有帮助。2

控制理论控制理论是工程学与数学的跨领域分支,主要处理在有输入信号的动力系统的行为。系统的外部输入称为“参考值”,系统中的一个或多个变量需随着参考值变化,控制器处理系统的输入,使系统输出得到预期的效果。

控制理论一般的目的是借由控制器的动作让系统稳定,也就是系统维持在设定值,而且不会在设定值附近晃动。

连续系统一般会用微分方程来表示。若微分方程是线性常系数,可以将微分方程取拉普拉斯转换,将其输入和输出之间的关系用传递函数表示。若微分方程为非线性,已找到其解,可以将非线性方程在此解附近进行线性化。若所得的线性化微分方程是常系数的,也可以用拉普拉斯转换得到传递函数。

传递函数也称为系统函数或网络函数,是一个数学表示法,用时间或是空间的频率来表示一个线性常系数系统中,输入和输出之间的关系。

控制理论中常用方块图来说明控制理论的内容。2

最优控制最优控制理论是要针对控制问题找到控制法则,可以满足所要求的最佳化准则。

最优控制理论是变分法的推广,着重于研究使控制系统的指标达到最优化的条件和方法。这门学科的开创性工作主要是由1950年代前苏联的庞特里亚金和美国的贝尔曼所完成,这些是以爱德华J.麦克沙恩所发展的变分法为其基础。最优控制可以视为是控制理论中的一种控制策略。1

本词条内容贡献者为:

曹慧慧 - 副教授 - 中国矿业大学

科技工作者之家

科技工作者之家APP是专注科技人才,知识分享与人才交流的服务平台。