序贯理性

科技工作者之家 2020-11-17

序贯理性是指每个参与人在其每一个行动时点上都将重新优化自己的选择,并且会把自己将来会重新优化其选择这一点也纳入当前的优化选择当中。

基本内容序贯决策是指按时间顺序排列起来,以得到按顺序的各种决策(策略),是用于随机性或不确定性动态系统最优化的决策方法。

一个具备序贯理性的参与人很清楚自己在每一个需要作出决定的时刻都需要对已有的决策进行优化,而且在做这种优化的时候必须把未来需要重新优化的这一事实考虑在现有的优化决策当中。

生活中难以达到序贯理性原因是:

人们的计算能力是有限的;

人们的理性本身也是有限的(比如感情用事、冲动行事、冒险倾向等)。1

举例用策略式(或称为标准式)表示静态博弈,用扩展式表示动态或多阶段博弈,描述博弈中的序列结构。策略式博弈中的参与人的策略一旦制定,不再改变。扩展式博弈中的参与人有序贯理性:

参与人可以在博弈的每一个时点重新制定策略;

参与人知道未来可以优化自已的策略。1

实际应用序贯决策方法广泛应用于物流配送车辆调度、家电产品运营、应急资源配置等情况。应用序贯决策方法,可大大减少计算量。同时,对于给定的动态系统而言,初始状态向量为已知,系统经过相当长时间运行后,所选择的一序列方案,是每一阶段的平均收益最大的方案。

在生活中,按照逆向归纳法,我们就能找出下棋时的均衡路径,这样我们就分不出高下,只能成为平手。然而,现实中胜负是常见的。其本质就在于对手之间的序贯理性是不一样,他们对局势的洞察力是不一样的。有经验的老手,眼光显然比一个新手强上不止几百倍。2

本词条内容贡献者为:

武伟 - 高级工程师 - 天津直升机有限责任公司

科技工作者之家

科技工作者之家APP是专注科技人才,知识分享与人才交流的服务平台。