本篇文章2992字,读完约7分钟

雷锋。新智能驾驶出版社:4月24日,雷锋。(公开号码:雷锋。在2017年上海车展上,微软俱乐部举办了主题沙龙“智能驾驶的关键”。这篇文章由清华大学自动化系统工程研究所的姚教授分享。本文描述了v2x技术在自主驾驶中的一个重要应用场景,即自主车辆在交叉口相遇时的交通决策问题。

*姚,清华大学自动化系统工程学院教授,在上海车展新志佳和mmc沙龙

清华大学的一篇论文《基于完全信息动态博弈的无灯路口车辆协同驾驶模型》(作者:、姚)试图解决一个很多人可能想过但还没有解决的问题,即让自驾车辆在路口相遇时相互协调,最终相互配合完成交通决策。

你可以把它看作v2x的一个应用来辅助自动驾驶决策。至于v2x在自动驾驶中的作用,人们更多地谈论v2x在环境感知中的作用,也就是说,除了汽车本身的传感器感知之外,v2x被用来完成更大范围的环境感知。

但是v2x也起着重要的作用,那就是协同决策。目前,我们可以基于自我感知做出决策,但v2x环境使“群体决策”成为可能,这可能是未来自动驾驶的一个重要应用。

如何基于v2x实现群体决策?以具体场景为例,即无信号交叉口的车车合作。当两辆车到达十字路口时,在没有控制中心的情况下,听谁的?他们之间有一种博弈关系,必须保证双方在博弈中安全顺利地通过交叉路口。

首先,做一个简单的场景描述。

1.有参与的车辆,一辆从左边来,一辆从底部来。我们知道彼此的速度、加速度和位置,以及到交叉口的距离。

2.交叉口是无信号交叉口,即没有信号控制。

3.有v2x环境,车辆车间可以交互。

以上是前提。接下来,问题被分解了。

首先,判断车辆之间是否存在冲突。我们选择一个指标来描述冲突,这就是所谓的“冲突时间差”,即两辆车到达冲突点的时间差。差异越小,碰撞的可能性就越大。如果它是零,它将会碰撞。如果差异很大,那就意味着在完全不同的时间通过交叉路口,而且永远不会发生碰撞。

第二,如果有冲突,如何提前避免。这部分有很多因素要考虑。为了确保安全,当两辆车相撞时,需要一种算法来确保它们最终不会相撞。因此,通过交叉口可以被视为一个博弈问题。游戏包括三个要素。

元素1:对象,游戏必须有双方,这里的对象是车辆。

要素2:策略,忽略特定的油门、刹车和其他不同的操作,使用“加速”作为各种操作的表现,这构成了策略。

要素3:收入。有必要定义游戏的收入。我们在模型中定义了三种好处,即安全、速度和舒适。安全是首要要求,也就是说,你不能撞车;快速是指让车辆尽快通过交叉口;舒适性是指满足人们的驾驶习惯,不过度加速和减速,保证驾驶舒适性。

这些是一些决策的基本场景假设。

基于此,两辆车的交叉博弈在数学上可视为一个有约束的多目标规划问题。也就是说,当不同加速度组合时,增益“ω”最大。涉及到一些数学问题,如多重纳什均衡,寻找最优解等。在这个模型中,我们使用遗传算法来寻找最优解。

下面是这个问题的具体计算。

对于两辆车,我们必须首先判断它们是否进入冲突区。游戏系统的示例模型如下。红点表示碰撞点,到达碰撞点的车辆之间的时间差用于判断它们是否进入冲突区域。

*摘自该模型作者发表的论文

如果两辆车没有进入冲突区域,他们不需要玩游戏,只是正常驾驶。一旦进入冲突区域,游戏就开始了,利润通过游戏最大化。我们谈到了三个收入指标(安全、速度和舒适),所以我们应该详细定义这三个指标。

1.安全指示器。安全指数是指到达冲突点时的时间差。在这个模型中,差异必须大于给定的阈值以确保安全性。这个公式比较简单,基本上是中学里关于距离、速度和时间的简单公式。

2.快速索引。指两个周期内速度的变化,是对当前时刻加速度值的直接反应。

3.舒适度指数。事实上,舒适度指数可以直接用加速度的绝对值来表示。绝对值越大,舒适度越差。在这个模型中,我们基本上选择0.25克加速度指数来玩游戏。当然,前提是要安全。如果发生碰撞,可以牺牲舒适度指数。此外,舒适指数还定义了一些不良的加速行为,如加速增加200%,或加速时转为反向加速。

对于以上三个收入值,我们需要做一个标准化工作。这三种数据的维度是不同的,有的是时间,有的是加速度,怎么总结呢?这涉及到标准化。这里没有具体说明,基本的计算方法是从当前值中减去期望值,然后除以标准偏差。最后,需要遗传算法尽可能地获得全局最优解。

仿真实验对于这一理论,我们没有在实际的车辆控制中使用,只是进行了仿真实验。这是一个具体的模拟例子。两辆车的初始速度分别为60公里/小时和50公里/小时,距离碰撞点的距离分别为250米和150米。设定了约束条件:最大速度不能超过70公里/小时,最小速度为零(即停止),加速度值控制在0.3克之间。这里不描述求解的遗传算法,主要用于获得最优解。下图是两车交叉口的模拟实验组合图。

清华大学研究成果:如何用博弈论解决自动驾驶路口的会车决策问题?

*摘自该模型作者发表的论文

从上图可以看出,模拟实验得到了相当有趣的结果。在这个场景中,两辆车之间有两个游戏。首次计算出冲突点的时间差小于给定阈值。经过一轮比赛,冲突危险解除,判定安全后再次开始自由驾驶;在自由驾驶了一段时间后,它进入了一个游戏过程,最后直到车辆安全通过十字路口。

上图显示了许多游戏曲线。第一行曲线是收入曲线,红色和蓝色代表两辆车各自的收入,绿色代表两辆车的总收入。第二行是加速度曲线。以加速度曲线为例,游戏效果不是特别好,因为跳跃很大,游戏算法还需要改进。第三行是速度曲线。

最后一行的影响时差(tdtc)。我们为tdtc设置了一个阈值,当tdtc小于阈值时,我们会通知有碰撞风险,并开始游戏。这个过程正在改变。一旦tdtc超过阈值,就证明没有风险,双方都可以自由驾驶。最后,车辆安全离开交通路口,这是一个完整的游戏过程。

在一些具体参数上,我们主要考虑三点。

首先是收入。如图所示,对于第一辆车,它得到负回报,而第二辆车得到正回报。我们的游戏规则是将两者相加,以最大化整体回报。

第二,高速比和不良加速。

第三,收入函数系数。这是一个非常重要的参数,这个系数将直接影响最终游戏的效果。我认为具体的确定方法值得研究。例如,如果α较大,则强调安全性,如果β较大,则强调快速性,如果γ较大,则取决于您如何选择评估方法。

总结该模型的研究,考虑驾驶安全性和舒适性之间的博弈和决策,避免碰撞是最重要的部分,尽量避免降低舒适性的操作。在未来,通过丰富策略集,我们可以在模型的基础上有更多的相关研究方向和途径。

同时,群体决策算法也是一个亮点。刚才,它只是一个两车模型。我们的博士生仍在研究交叉口多车博弈的一般模型。

当然,我们目前的实验仍然是基于模拟,但我们也在制造一些实用的产品。我们的研究团队与星运互联网公司合作,开发了一些v2x产品,如智能车载终端、路边通讯器、路边主机等。,内置多种通信模块,支持多种通信方式接入,完成车辆与道路之间的数据交互。目前,我们的产品主要应用于各种自动驾驶和智能驾驶考试场所,并介绍了一些实际应用。例如,我们在校园总线系统中安装了路边系统,并在校园总线上安装了车载设备来测试和积累数据。此外,在芜湖交警支队的支持下,我们在中心城市的交叉口建设了v2x基础设施。之后,我们还与许多企业和测试站点合作,在实际项目中进行测试。

清华大学研究成果:如何用博弈论解决自动驾驶路口的会车决策问题?

雷锋。连接汽车和一切的v2x技术将如何改变自动驾驶行业?

雷锋原创文章。严禁擅自转载。详情请参考转载说明。

来源:搜狐微门户

标题:清华大学研究成果:如何用博弈论解决自动驾驶路口的会车决策问题?

地址:http://www.shwmhw.com/shxw/60417.html