基于先验策略的集成深度强化学习在非结构化地形下无人履带车辆安全–效率平衡导航研究 | MDPI WEVJ

MDPI工程科学 2025-12-10 16:06
文章摘要
本文背景是无人履带车辆在建筑工程、山地搜救等复杂非结构化地形中面临履带打滑、地形干扰以及传统导航算法探索效率低、部署风险高的问题。研究目的是提出一种基于先验策略的集成深度强化学习算法(SAC-HP),以解决复杂环境下无人履带车辆安全与效率平衡的导航挑战。该算法通过融合集成SAC深度强化学习策略与基于动态窗口法的传统先验策略,构建混合高斯策略,并创新性地扩展状态空间,引入局部高程信息和车辆姿态变化特征,使车辆能感知地形并隐性学习打滑干扰。结论表明,该方法相较于传统SAC算法,收敛速度提升16%,在复杂地形中的导航成功率提高6%,轨迹振荡降低35%,并改善了轨迹平顺性与能耗表现,为无人履带车辆的智能自主导航提供了有效的新方案。
基于先验策略的集成深度强化学习在非结构化地形下无人履带车辆安全–效率平衡导航研究 | MDPI WEVJ
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。
MDPI工程科学
最新文章
热门类别
相关文章
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信