多智能体城市交通计算综合应用
<h1 id="城市交通信号控制的综合应用计算框架">城市交通信号控制的综合应用计算框架</h1><p><img src="https://img2020.cnblogs.com/blog/1918374/202111/1918374-20211102200932668-2009297508.png" alt="" loading="lazy"></p>
<ol>
<li>构建混合计算框架</li>
<li>构建城市交通真实环境<br>
<img src="https://img2020.cnblogs.com/blog/1918374/202111/1918374-20211102201531587-1991184483.png" alt="" loading="lazy"></li>
<li>构建城市交通仿真环境</li>
</ol>
<h1 id="城市多交叉路口交通信号控制组合算法">城市多交叉路口交通信号控制组合算法</h1>
<ol>
<li>
<p>算法背景<br>
现存研究存在以下不足:<br>
(1) 现有的交通仿真环境无法模拟更加接近真实的交通环境,导致城市交通信号仿真控制效果和实际路测效果具有一定差距,不能完全体现真实城市交通的运行状况;<br>
(2) 针对多路口交通信号控制优化 MARL 模型算法本身的控制效果并不是非常理想,博弈论、通信理论和 MARL 的组合研究不够深入,算法本身具备提升空间;<br>
(3) 对于城市交信号控制 MARL 算法在城市多个路口的工业级部署研究还不足;<br>
(4)现今绝大多数城市的交通信号控制仍然沿用上世纪 50、60 年代的控制技术,智能交通信号控制应用落地仍然具有广阔的前景。<br>
Nash-A2C、Nash-A3C、MAAC 算法优势在于理论和MARL 算法的优化,Mixed-MARL 优势在于考虑混合架构部署和网络时延。<br>
Nash-A3C 的实验结果表现在不考虑网络延时的情况下最为出色;在考虑网络带宽和网络时延的情况下,Mixed-MARL 的实验表现最佳。<br>
<img src="https://img2020.cnblogs.com/blog/1918374/202111/1918374-20211102205401656-489016647.png" alt="" loading="lazy"></p>
</li>
<li>
<p>算法过程<br>
城市多交叉路口交通信号控制组合算法 General-MARL 由三个子算法构成:<br>
(1)边缘计算节点算法 (Edge-General-control):处理交通监控视频,生成当前路口的交通状态文本信息,引入城市交通流量预测算法 GCN-GAN,具有真实城市交通流量预测能力,并与仿真环境实时同步(该部<br>
分非常灵活,可以引入其他流量预测算法)<br>
(2)雾计算节点算法 (Fog-General-control):融合 Nash-A2C 算法(Nash-A3C 算法的“平行宇宙”的节点)和 MAAC 算法汇总的智能通信部分,产生城市交通信号的控制信号<br>
(3)云计算节点的算法 (Cloud-General-control):部署 Nash-A2C算法(Nash-A3C 算法的“平行宇宙”的中心节点)<br>
算法部署架构图:<br>
<img src="https://img2020.cnblogs.com/blog/1918374/202111/1918374-20211102205716883-1008991252.png" alt="" loading="lazy"><br>
云计算算法步骤:<br>
<img src="https://img2020.cnblogs.com/blog/1918374/202111/1918374-20211102205805603-1439797516.png" alt="" loading="lazy"><br>
边缘计算算法步骤:<br>
<img src="https://img2020.cnblogs.com/blog/1918374/202111/1918374-20211102205847791-943396999.png" alt="" loading="lazy"><br>
雾计算算法步骤:<br>
<img src="https://img2020.cnblogs.com/blog/1918374/202111/1918374-20211102210002710-1177328644.png" alt="" loading="lazy"><br>
<img src="https://img2020.cnblogs.com/blog/1918374/202111/1918374-20211102210028963-1655636051.png" alt="" loading="lazy"></p>
</li>
</ol>
<h1 id="仿真实验">仿真实验</h1>
<p>配置:<br>
<img src="https://img2020.cnblogs.com/blog/1918374/202111/1918374-20211102210130821-1708370986.png" alt="" loading="lazy"><br>
考虑延时的训练过程:<br>
<img src="https://img2020.cnblogs.com/blog/1918374/202111/1918374-20211102210523714-1440304306.png" alt="" loading="lazy"><br>
实验结果:<br>
<img src="https://img2020.cnblogs.com/blog/1918374/202111/1918374-20211102210549566-368097514.png" alt="" loading="lazy"><br>
<img src="https://img2020.cnblogs.com/blog/1918374/202111/1918374-20211102210616567-1587472260.png" alt="" loading="lazy"><br>
每个模型的平均通过速度:<br>
<img src="https://img2020.cnblogs.com/blog/1918374/202111/1918374-20211102210708477-420087670.png" alt="" loading="lazy"><br>
每个模型的平均等待时长:<br>
<img src="https://img2020.cnblogs.com/blog/1918374/202111/1918374-20211102210733577-379468198.png" alt="" loading="lazy"><br>
每个模型的车辆累计等待时长:<br>
<img src="https://img2020.cnblogs.com/blog/1918374/202111/1918374-20211102210757697-2047791351.png" alt="" loading="lazy"><br>
每个模型的网络延时时间:<br>
<img src="https://img2020.cnblogs.com/blog/1918374/202111/1918374-20211102210815781-589402675.png" alt="" loading="lazy"></p>
<p>实验结论:<br>
多智能体强化学习在城市交通信号控制研究需要考虑仿真环境、算法过程、部署架构等多方面因素。General-MARL 算法综合考虑了这些因素,从实验结果上分析,表现最佳。</p><br><br>
来源:https://www.cnblogs.com/suancai/p/15501097.html
頁:
[1]