一种基于贝叶斯博弈的列车自主防护方法和系统与流程

2021-02-04 17:02:07|

374|

起点商标网

本发明涉及轨道交通自主控制技术领域，尤其涉及一种基于贝叶斯博弈的列车自主防护方法和系统。

背景技术：

轨道交通作为一种绿色交通方式在综合交通运输体系中发挥的骨干作用已成为共识。作为轨道交通的“大脑和神经中枢”，列车运行控制系统根据列车在轨道交通线路上运行的实时状态，通过车载设备和地面设备对列车的制动方式与运行速度等进行控制、监督和调整，保障列车安全高效运行。在基于通信的列车运行控制系统(cbtc)中，区域控制区通过车地通信列车位置等状态信息，根据这些信息，区域控制器为列车计算并分配移动授权，列车自动防护系统(atp)根据列车移动授权生成列车安全防护速度曲线保障列车安全运行。随着轨道交通行业和人工智能等新技术的快速发展，列控系统正在向集移动闭塞、自动驾驶、车车通信和智能调度为一体的综合自动化方向发展。国内外研究均表明，车车通信作为下一代运控系统的核心，与车地通信方式相比，车车通信不通过地面设备实现列车间的直接通信，将一部分联锁和地面设备的功能集成到车载控制器中，可有效降低通信时延、减少轨旁设备数量和提高列车的自主权。在车车通信模式下，列车直接获取前行方向上的前车位置等信息，更新移动授权。但是在车车通信的过程中，存在误码、丢包、断链等异常情况，当通信出现异常时，通信传输的列车位置等信息也会出现错误，以错误的列车位置更新的移动授权也存在错误，使列车存在与前车相撞的风险。为了避免相撞风险，需对通信状态进行判别，降低通信状态异常时所造成的的影响。

技术实现要素：

本发明的实施例提供了种基于贝叶斯博弈的列车自主防护方法和系统，针对车车通信异常时导致列车运行安全存在隐患的问题，利用贝叶斯博弈，通过主动判别每次通信过程是否异常，通信异常时则对错误的列车位置进行修正，使修正后的列车位置在安全范围内，以此实现对列车的主动防护。

为了实现上述目的，本发明采取了如下技术方案。

一种基于贝叶斯博弈的列车自主防护方法，包括：

基于列车行驶数据，获得用于构建贝叶斯博弈模型的参数；

基于该参数，构建具有列车损失函数的贝叶斯博弈模型；

求解贝叶斯博弈模型，获得边界概率和后验概率，基于该边界概率和后验概率，判别列车的通信状态；

若列车的通信状态异常，对前车进行修正控制。

优选地，用于构建贝叶斯博弈模型的参数包括：上一周期列车与前车距离sa、列车上一周期内平均速度vm、前车位置信息更新周期t、列车当前位置sn和车车通信传输回的前车位置sq。

优选地，基于参数，构建具有列车损失函数的贝叶斯博弈模型包括：

基于参数，通过公式获得列车与前车的距离

令贝叶斯博弈中的车车通信的状态空间为φ∈φ＝{φ0,φ1}(2)；当φ＝φ0时，车车通信状态正常，前后车距离正确；当φ＝φ1时，车车通信状态异常，列车获得的前后车距离错误；

令列车对的动作策略空间为rk∈r＝{0,1}(3)；当rk＝1时表示列车选择相信的取值正确，并判别车车通信状态正常；当rk＝0时表示列车选择不相信正确，并判别车车通信状态异常，此时需对该进行修正；

令列车损失函数c^k为其中，为后验概率，表示当前车位置信息为时车车通信状态为φ的概率，为列车损失函数子项；

令车车通信正常(φ＝φ0)时的列车损失函数子项为

其中，βe∈[0,1]是效率权重系数，为常数。m(sa,vm)表示利用sa与vm重新计算的一个新的列车与前车距离，m(sa,vm)＝sa-(vm×t)，α1是一个常数，表示列车选择不相信时的任务成本，α1∈r⁺；

令车车通信状态异常(φ＝φ1)时列车损失函数子项为

其中，βs∈[0,1]为安全权重系数，且βs+βe＝1，j为调整参数，是一个常数，α2为常数，表示列车不相信时的任务成本，α2∈r⁺。

优选地，求解贝叶斯博弈模型，获得边界概率和后验概率包括：

对列车损失函数c^k进行展开，获得

当时，基于公式(7)获得

通过公式获得边界概率p；

通过公式获得后验概率

基于边界概率和后验概率，判别列车的通信状态包括：

当时，获得

当时，获得执行对前车进行修正控制的步骤。

优选地，对前车进行修正控制包括：

设前车位置在某个周期内无变化；

通过m(sa,vm)＝sa-(vm×t)(12)获得该某个周期内列车与前车的距离；

基于该该某个周期内列车与前车的距离更新前车的移动授权，使前车不在移动授权终点之内。

第二方面，本发明提供一种基于贝叶斯博弈的列车自主防护系统，包括列车信息采集模块、贝叶斯博弈判别模块和列车位置修正模块；

列车信息采集模块用于基于列车行驶数据，获得用于构建贝叶斯博弈模型的参数，并将该参数发送到贝叶斯博弈判别模块；

贝叶斯博弈判别模块用于基于接收到的参数，构建具有列车损失函数的贝叶斯博弈模型；还用于求解贝叶斯博弈模型，获得边界概率和后验概率，基于该边界概率和后验概率，判别列车的通信状态；

列车位置修正模块用于当列车的通信状态异常时，对前车进行修正控制。

由上述本发明的实施例提供的技术方案可以看出，本发明提供的一种基于贝叶斯博弈的列车自主防护方法和系统，针对车车通信异常时导致列车运行安全存在隐患的问题，利用贝叶斯博弈，通过主动判别每次通信过程是否异常，通信异常时则对错误的列车位置进行修正，使修正后的列车位置在安全范围内，以此实现对列车的主动防护。本发明提供的方法和系统，利用上一通信周期的列车与前车位置、列车速度和本周期内列车与车车通信传输的前车位置来判断车车通信的状态，以此来欲保护由于车车通信状态异常所造成其传输的前车位置出现错误时列车的运行安全；创新性地将贝叶斯博弈引入到列车防护领域，可以根据所掌握的信息，来估计车车通信状态，通过求解边界概率与更新后验概率来实现车车通信状态的判别，并修正由于车车通信状态所导致错误的前车位置信息，以此保护列车安全运行。

本发明附加的方面和优点将在下面的描述中部分给出，这些将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为错误的移动授权可导致列车与前车出现相撞事故示意图；

图2为本发明提供的一种基于贝叶斯博弈的列车自主防护方法处理流程图；

图3为本发明提供的一种基于贝叶斯博弈的列车自主防护方法的一种优选实施例的处理流程图；

图4为本发明提供的一种基于贝叶斯博弈的列车自主防护系统的逻辑框图。

具体实施方式

下面详细描述本发明的实施方式，所述实施方式的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的，仅用于解释本发明，而不能解释为对本发明的限制。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解，当我们称元件被“连接”或“耦接”到另一元件时，它可以直接连接或耦接到其他元件，或者也可以存在中间元件。此外，这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样定义，不会用理想化或过于正式的含义来解释。

为便于对本发明实施例的理解，下面将结合附图以几个具体实施例为例做进一步的解释说明，且各个实施例并不构成对本发明实施例的限定。

本发明提供了一种基于贝叶斯博弈的列车自主防护方法，用于解决如下技术问题。在现有的基于通信的列车运行控制系统中，区域控制器通过车地通信获取其管辖范围内的列车位置，并根据列车位置为列车更新并分配移动授权。而随着技术的发展，车车通信逐渐受到重视，可取代当前车地通信方式使列车间实现直接通信。列车通过车车通信直接获取相邻列车位置等信息并更新移动授权，大大提高了自主权。但是在车车通信的过程中，会存在误码、丢包、断链等异常情况，当通信出现异常时，通信传输的列车位置等信息也会出现错误，此时以错误的列车位置更新的移动授权也存在错误，使列车存在与前车相撞的风险。现有的列控系统中并没有针对通信异常造成移动授权错误的防护措施，这使列车在运行过程中存在与前车撞安全隐患。如图1所示，错误的移动授权可导致列车与前车出现相撞事故。

参见图2，本发明提供的一种基于贝叶斯博弈的列车自主防护方法，包括如下步骤：

基于列车行驶数据，获得用于构建贝叶斯博弈模型的参数；

基于该参数，构建具有列车损失函数的贝叶斯博弈模型；

求解贝叶斯博弈模型，获得边界概率和后验概率，基于该边界概率和后验概率，判别列车的通信状态；

若列车的通信状态异常，对前车进行修正控制。

本发明提供的方法利用贝叶斯博弈首先来判断车车通信状态，若判断通信状态异常则对列车位置修正，实现对列车的主动防护。

贝叶斯博弈分为不完全信息静态和不完全信息动态博弈。在博弈过程中，参与人只清楚自己类型，但不知道其他参与人的类型与选择策略。在这种信息不完全的情况下，参与人根据掌握的信息，估计其他参与人的类型与选择策略，然后计算自己选择不同策略时的损失函数，选取损失函数最小时所对应的策略来采取行动。在重复的贝叶斯博弈过程中，首次博弈参与人的类型的先验概率由经验和历史数据确定。在后续贝叶斯博弈的回合之中，将上一次博弈更新的后验概率当作本回合博弈的先验概率。后验概率为参与人根据已有信息和其他的参与人选择的策略修正先验概率后得到。

进一步的，上述的用于构建贝叶斯博弈模型的参数位列车与前车的参数，包括：上一周期列车与前车距离sa、列车上一周期内平均速度vm、前车位置信息更新周期t、列车当前位置sn和车车通信传输回的前车位置sq。

更进一步的，如图3所示，上述的基于参数，构建具有列车损失函数的贝叶斯博弈模型的步骤包括：

基于上述参数，通过公式获得列车与前车的距离

令贝叶斯博弈中的车车通信的状态空间为φ∈φ＝{φ0,φ1}(2)；

当φ＝φ0时，车车通信状态正常，前后车距离正确；当φ＝φ1时，车车通信状态异常，列车获得的前后车距离错误；

令列车对的动作策略空间为rk∈r＝{0,1}(3)；

当rk＝1时表示列车选择相信的取值正确，并判别车车通信状态正常；当rk＝0时表示列车选择不相信正确，并判别车车通信状态异常，此时需对该进行修正；

令列车损失函数c^k为其中，为后验概率，表示当前车位置信息为时车车通信状态为φ的概率，为列车损失函数子项；

令车车通信正常(φ＝φ0)时的列车损失函数子项为

令车车通信状态异常(φ＝φ1)时列车损失函数子项为

其中，βs∈[0,1]为安全权重系数，且βs+βe＝1，j为调整参数，是一个常数，α2为常数，表示列车不相信时的任务成本，α2∈r⁺。

更进一步的，上述的求解贝叶斯博弈模型，获得边界概率和后验概率包括：

对所述列车损失函数c^k进行展开，获得

列车对于有两种动作策略，即相信与不相信，当列车选择不相信时，基于公式(7)获得列车的损失函数

当列车选择相信时，基于公式(7)获得列车的损失函数

通过公式获得边界概率p；

通过公式获得更新后的后验概率

所述的基于边界概率和后验概率，最小化列车损失函数来选择最优动作策略和完成对车车通信的判别，结果分下面三种：

(1)此时即列车选择相信时的损失函数与列车选择不相信时的损失函数相等。

(2)此时即列车选择相信时的损失函数小于列车选择不相信时的损失函数。

(3)此时即列车选择相信时的损失函数大于列车选择不相信时的损失函数。

当时，将此周期内的车车通信周期状态判断为正常，其传输的前车位置也正确。当时，将此周期内的车车通信周期状态判断为异常，其传输的前车位置错误，转到上述的第四个步骤进行修正操作。

更进一步的，上述的对前车进行修正控制包括：

当车车通信异常时，对前车位置进行修正，将上一周期内的前车位置作为本周期的前车位置，即假定前车位置在本周期内没变。将m(sa,vm)＝sa-(vm×t)(12)作为本周期内列车与前车的距离，即利用上一周期内的列车与前车间的距离sa减去上一周期内列车的运行距离来表示当前周期内列车与前车的距离，利用此距离更新的移动授权可确保前车不在移动授权终点之内，保障列车运行安全。应当理解的是，移动授权即列车根据运行方向被授权进入并通过前方的某个轨道区段。

第二方面，本发明提供一种基于贝叶斯博弈的列车自主防护系统，如图4所示，包括列车信息采集模块201、贝叶斯博弈判别模块202和列车位置修正模块203；

列车信息采集模块201用于基于列车行驶数据，获得用于构建贝叶斯博弈模型的参数，并将该参数发送到所述贝叶斯博弈判别模块202；

贝叶斯博弈判别模块202用于基于接收到的所述参数，构建具有列车损失函数的贝叶斯博弈模型；还用于求解贝叶斯博弈模型，获得边界概率和后验概率，基于该边界概率和后验概率，判别列车的通信状态；

列车位置修正模块203用于当列车的通信状态异常时，对前车进行修正控制。

综上所述，本发明提供的一种基于贝叶斯博弈的列车自主防护方法和系统，针对车车通信异常时导致列车运行安全存在隐患的问题，利用贝叶斯博弈，通过主动判别每次通信过程是否异常，通信异常时则对错误的列车位置进行修正，使修正后的列车位置在安全范围内，以此实现对列车的主动防护。本发明提供的方法和系统，利用上一通信周期的列车与前车位置、列车速度和本周期内列车与车车通信传输的前车位置来判断车车通信的状态，以此来欲保护由于车车通信状态异常所造成其传输的前车位置出现错误时列车的运行安全；创新性地将贝叶斯博弈引入到列车防护领域，可以根据所掌握的信息，来估计车车通信状态，通过求解边界概率与更新后验概率来实现车车通信状态的判别，并修正由于车车通信状态所导致错误的前车位置信息，以此保护列车安全运行。

本领域普通技术人员可以理解：附图只是一个实施例的示意图，附图中的模块或流程并不一定是实施本发明所必须的。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如rom/ram、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置或系统实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

起点商标作为专业知识产权交易平台，可以帮助大家解决很多问题，如果大家想要了解更多知产交易信息请点击【在线咨询】或添加微信【19522093243】与客服一对一沟通，为大家解决相关问题。