清华大学研究成果：如何用博弈论解决自动驾驶路口的会车决策问题？-搜狐微门户

本篇文章2992字，读完约7分钟

雷锋。新智能驾驶出版社:4月24日，雷锋。(公开号码:雷锋。在2017年上海车展上，微软俱乐部举办了主题沙龙“智能驾驶的关键”。这篇文章由清华大学自动化系统工程研究所的姚教授分享。本文描述了v2x技术在自主驾驶中的一个重要应用场景，即自主车辆在交叉口相遇时的交通决策问题。

*姚，清华大学自动化系统工程学院教授，在上海车展新志佳和mmc沙龙

清华大学的一篇论文《基于完全信息动态博弈的无灯路口车辆协同驾驶模型》(作者:、姚)试图解决一个很多人可能想过但还没有解决的问题，即让自驾车辆在路口相遇时相互协调，最终相互配合完成交通决策。

你可以把它看作v2x的一个应用来辅助自动驾驶决策。至于v2x在自动驾驶中的作用，人们更多地谈论v2x在环境感知中的作用，也就是说，除了汽车本身的传感器感知之外，v2x被用来完成更大范围的环境感知。

但是v2x也起着重要的作用，那就是协同决策。目前，我们可以基于自我感知做出决策，但v2x环境使“群体决策”成为可能，这可能是未来自动驾驶的一个重要应用。

如何基于v2x实现群体决策？以具体场景为例，即无信号交叉口的车车合作。当两辆车到达十字路口时，在没有控制中心的情况下，听谁的？他们之间有一种博弈关系，必须保证双方在博弈中安全顺利地通过交叉路口。

首先，做一个简单的场景描述。

1.有参与的车辆，一辆从左边来，一辆从底部来。我们知道彼此的速度、加速度和位置，以及到交叉口的距离。

2.交叉口是无信号交叉口，即没有信号控制。

3.有v2x环境，车辆车间可以交互。

以上是前提。接下来，问题被分解了。

首先，判断车辆之间是否存在冲突。我们选择一个指标来描述冲突，这就是所谓的“冲突时间差”，即两辆车到达冲突点的时间差。差异越小，碰撞的可能性就越大。如果它是零，它将会碰撞。如果差异很大，那就意味着在完全不同的时间通过交叉路口，而且永远不会发生碰撞。

第二，如果有冲突，如何提前避免。这部分有很多因素要考虑。为了确保安全，当两辆车相撞时，需要一种算法来确保它们最终不会相撞。因此，通过交叉口可以被视为一个博弈问题。游戏包括三个要素。

元素1:对象，游戏必须有双方，这里的对象是车辆。

要素2:策略，忽略特定的油门、刹车和其他不同的操作，使用“加速”作为各种操作的表现，这构成了策略。

要素3:收入。有必要定义游戏的收入。我们在模型中定义了三种好处，即安全、速度和舒适。安全是首要要求，也就是说，你不能撞车；快速是指让车辆尽快通过交叉口；舒适性是指满足人们的驾驶习惯，不过度加速和减速，保证驾驶舒适性。

这些是一些决策的基本场景假设。

基于此，两辆车的交叉博弈在数学上可视为一个有约束的多目标规划问题。也就是说，当不同加速度组合时，增益“ω”最大。涉及到一些数学问题，如多重纳什均衡，寻找最优解等。在这个模型中，我们使用遗传算法来寻找最优解。

下面是这个问题的具体计算。

对于两辆车，我们必须首先判断它们是否进入冲突区。游戏系统的示例模型如下。红点表示碰撞点，到达碰撞点的车辆之间的时间差用于判断它们是否进入冲突区域。

*摘自该模型作者发表的论文

如果两辆车没有进入冲突区域，他们不需要玩游戏，只是正常驾驶。一旦进入冲突区域，游戏就开始了，利润通过游戏最大化。我们谈到了三个收入指标(安全、速度和舒适)，所以我们应该详细定义这三个指标。

1.安全指示器。安全指数是指到达冲突点时的时间差。在这个模型中，差异必须大于给定的阈值以确保安全性。这个公式比较简单，基本上是中学里关于距离、速度和时间的简单公式。

2.快速索引。指两个周期内速度的变化，是对当前时刻加速度值的直接反应。

3.舒适度指数。事实上，舒适度指数可以直接用加速度的绝对值来表示。绝对值越大，舒适度越差。在这个模型中，我们基本上选择0.25克加速度指数来玩游戏。当然，前提是要安全。如果发生碰撞，可以牺牲舒适度指数。此外，舒适指数还定义了一些不良的加速行为，如加速增加200%，或加速时转为反向加速。

对于以上三个收入值，我们需要做一个标准化工作。这三种数据的维度是不同的，有的是时间，有的是加速度，怎么总结呢？这涉及到标准化。这里没有具体说明，基本的计算方法是从当前值中减去期望值，然后除以标准偏差。最后，需要遗传算法尽可能地获得全局最优解。

仿真实验对于这一理论，我们没有在实际的车辆控制中使用，只是进行了仿真实验。这是一个具体的模拟例子。两辆车的初始速度分别为60公里/小时和50公里/小时，距离碰撞点的距离分别为250米和150米。设定了约束条件:最大速度不能超过70公里/小时，最小速度为零(即停止)，加速度值控制在0.3克之间。这里不描述求解的遗传算法，主要用于获得最优解。下图是两车交叉口的模拟实验组合图。

清华大学研究成果：如何用博弈论解决自动驾驶路口的会车决策问题？

*摘自该模型作者发表的论文

从上图可以看出，模拟实验得到了相当有趣的结果。在这个场景中，两辆车之间有两个游戏。首次计算出冲突点的时间差小于给定阈值。经过一轮比赛，冲突危险解除，判定安全后再次开始自由驾驶；在自由驾驶了一段时间后，它进入了一个游戏过程，最后直到车辆安全通过十字路口。

上图显示了许多游戏曲线。第一行曲线是收入曲线，红色和蓝色代表两辆车各自的收入，绿色代表两辆车的总收入。第二行是加速度曲线。以加速度曲线为例，游戏效果不是特别好，因为跳跃很大，游戏算法还需要改进。第三行是速度曲线。

最后一行的影响时差(tdtc)。我们为tdtc设置了一个阈值，当tdtc小于阈值时，我们会通知有碰撞风险，并开始游戏。这个过程正在改变。一旦tdtc超过阈值，就证明没有风险，双方都可以自由驾驶。最后，车辆安全离开交通路口，这是一个完整的游戏过程。

在一些具体参数上，我们主要考虑三点。

首先是收入。如图所示，对于第一辆车，它得到负回报，而第二辆车得到正回报。我们的游戏规则是将两者相加，以最大化整体回报。

第二，高速比和不良加速。

第三，收入函数系数。这是一个非常重要的参数，这个系数将直接影响最终游戏的效果。我认为具体的确定方法值得研究。例如，如果α较大，则强调安全性，如果β较大，则强调快速性，如果γ较大，则取决于您如何选择评估方法。

总结该模型的研究，考虑驾驶安全性和舒适性之间的博弈和决策，避免碰撞是最重要的部分，尽量避免降低舒适性的操作。在未来，通过丰富策略集，我们可以在模型的基础上有更多的相关研究方向和途径。

同时，群体决策算法也是一个亮点。刚才，它只是一个两车模型。我们的博士生仍在研究交叉口多车博弈的一般模型。

当然，我们目前的实验仍然是基于模拟，但我们也在制造一些实用的产品。我们的研究团队与星运互联网公司合作，开发了一些v2x产品，如智能车载终端、路边通讯器、路边主机等。，内置多种通信模块，支持多种通信方式接入，完成车辆与道路之间的数据交互。目前，我们的产品主要应用于各种自动驾驶和智能驾驶考试场所，并介绍了一些实际应用。例如，我们在校园总线系统中安装了路边系统，并在校园总线上安装了车载设备来测试和积累数据。此外，在芜湖交警支队的支持下，我们在中心城市的交叉口建设了v2x基础设施。之后，我们还与许多企业和测试站点合作，在实际项目中进行测试。

清华大学研究成果：如何用博弈论解决自动驾驶路口的会车决策问题？

雷锋。连接汽车和一切的v2x技术将如何改变自动驾驶行业？

雷锋原创文章。严禁擅自转载。详情请参考转载说明。

来源：搜狐微门户

标题：清华大学研究成果：如何用博弈论解决自动驾驶路口的会车决策问题？

地址：http://www.shwmhw.com/shxw/60417.html

清华大学研究成果：如何用博弈论解决自动驾驶路口的会车决策问题？

相关推荐

工信部：3月份新能源汽车产销量降幅收窄

货车洗车机哪个牌子好-更久远的牌子

“光能被黑洞吸住，是不是证明黑洞中有东西比光速还快？”

复工在即中国系统推出公益性疫情防控系统“疫情通”

阿里成了网易考拉的“爸爸” 只花了20亿美元

民航局：前九月民航完成旅客运输量达5亿人次

小米在印度推出全新MIUI系统不预装任何被禁的应用

10点聊电商：1919品牌商城对外开放全国门店将变前置仓

中国政务服务平台微信小程序上线：可查四六级、学历、学位...

尚德机构与中国联通达成5G应用合作开启在线教育升级

本月热文

阿里云账号代购，阿里云购买相同配置的实例

挑选太仓SMT智能料架公司，绝不踩雷的方法！_佰斯特POUSTO

win10全屏优化会让游戏卡吗_win10全屏优化会让游戏卡吗

阿里云国际服务器购买，阿里云国际代理商

国际版阿里云/腾讯云：免费账号：运用邮箱注册的账号、充值教程

加盟儿童美术教育的投资人要符合哪些条件呢

win10优化开机启动项_win10如何优化开机启动项

win7运行速度提高90pedit_

win10自带清理软件_win10清理软件哪个好

阿里云国际账号24h自助充，阿里云服务器购买

最新发布

wf展会2022上海_wf展会2022上海延期

ween是什么牌子_ween是什么牌子衣服

ween是什么公司_WeEn是什么公司

电厂工地洗车机是如何进行水循环使用的？

web问如何优化网站_web网页优化

保持防静电贯通式货架高效安全的秘诀_佰斯特POUSTO

阿里云服务器购买，阿里云账号免实名注册

阿里云国际服务器购买，阿里云免实名注册

阿里云国际账号免实名注册，阿里云服务器购买

阿里云国际账号注册，阿里云服务器购买，阿里云24h小时自助充

网站简介