基于先验策略的集成深度强化学习在非结构化地形下无人履带车辆安全–效率平衡导航研究 | MDPI WEVJ
MDPI工程科学
2025-12-10 16:06
文章摘要
本文背景是无人履带车辆在建筑工程、山地搜救等复杂非结构化地形中面临履带打滑、地形干扰以及传统导航算法探索效率低、部署风险高的问题。研究目的是提出一种基于先验策略的集成深度强化学习算法(SAC-HP),以解决复杂环境下无人履带车辆安全与效率平衡的导航挑战。该算法通过融合集成SAC深度强化学习策略与基于动态窗口法的传统先验策略,构建混合高斯策略,并创新性地扩展状态空间,引入局部高程信息和车辆姿态变化特征,使车辆能感知地形并隐性学习打滑干扰。结论表明,该方法相较于传统SAC算法,收敛速度提升16%,在复杂地形中的导航成功率提高6%,轨迹振荡降低35%,并改善了轨迹平顺性与能耗表现,为无人履带车辆的智能自主导航提供了有效的新方案。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。