系统仿真学报 ›› 2023, Vol. 35 ›› Issue (8): 1726-1736.doi: 10.16182/j.issn1004731x.joss.22-0412
收稿日期:2022-04-26
修回日期:2022-10-08
出版日期:2023-08-25
发布日期:2023-08-15
第一作者简介:杨来义(1997-),男,硕士生,研究方向为深度学习、强化学习等。E-mail:yanglaiyi@bjut.edu.cn
基金资助:
Laiyi Yang1(
), Jing Bi1(
), Haitao Yuan2
Received:2022-04-26
Revised:2022-10-08
Online:2023-08-25
Published:2023-08-15
杨来义,毕敬,苑海涛 . 基于SAC算法的移动机器人智能路径规划[J]. 系统仿真学报, 2023, 35(8): 1726-1736.
Laiyi Yang,Jing Bi,Haitao Yuan . Intelligent Path Planning for Mobile Robots Based on SAC Algorithm[J]. Journal of System Simulation, 2023, 35(8): 1726-1736.
| 1 |
朱大奇, 颜明重. 移动机器人路径规划技术综述[J]. 控制与决策, 2010, 25(7): 961-967.
|
|
|
|
| 2 |
黄晓冬, 苑海涛, 毕敬, 等. 基于DQN的海战场舰船路径规划及仿真[J]. 系统仿真学报, 2021, 33(10): 2440-2448.
|
|
|
|
| 3 |
|
| 4 |
张捍东, 郑睿, 岑豫皖. 移动机器人路径规划技术的现状与展望[J]. 系统仿真学报, 2005, 17(2): 439-443.
|
|
|
|
| 5 |
|
| 6 |
|
| 7 |
|
| 8 |
邓学强. 基于改进人工势场法的移动机器人路径规划[J]. 山东理工大学学报(自然科学版), 2014, 28(1): 38-41.
|
|
|
|
| 9 |
|
| 10 |
|
| 11 |
乔俊飞, 侯占军, 阮晓钢. 基于神经网络的强化学习在避障中的应用[J]. 清华大学学报(自然科学版), 2008, 48(增2): 1747-1750.
|
|
|
|
| 12 |
刘建伟, 高峰, 罗雄麟. 基于值函数和策略梯度的深度强化学习综述[J]. 计算机学报, 2019, 42(6): 1406-1438.
|
|
|
|
| 13 |
|
| 14 |
|
| 15 |
|
| 16 |
陶重犇, 雷祝兵, 李春光, 等. 基于改进模拟退火算法的搬运机器人路径规划[J]. 计算机测量与控制, 2018, 26(7): 182-185.
|
|
|
|
| 17 |
|
| 18 |
蒙盾, 胡卓, 张华军. 基于改进A*算法的多层邮轮疏散系统仿真[J]. 系统仿真学报, 2022, 34(6): 1375-1382.
|
|
|
|
| 19 |
徐力, 刘云华, 王启富. 自适应遗传算法在机器人路径规划的应用[J]. 计算机工程与应用, 2020, 56(18): 36-41.
|
|
|
|
| 20 |
|
| 21 |
|
| 22 |
|
| 23 |
罗阳阳, 彭晓燕. 基于改进PSO的四轮移动机器人全局路径规划[J]. 计算机仿真, 2020, 37(7): 373-379.
|
|
|
|
| 24 |
|
| 25 |
|
| 26 |
|
| 27 |
|
| 28 |
|
| 29 |
|
| 30 |
|
| 31 |
|
| 32 |
|
| 33 |
|
| 34 |
|
| 35 |
何柳柳, 杨羊, 李征, 等. 面向持续集成测试优化的强化学习奖励机制[J]. 软件学报, 2019, 30(5): 1438-1449.
|
|
|
| [1] | 江明, 何韬. 基于深度强化学习的带容量约束车辆路径问题求解[J]. 系统仿真学报, 2025, 37(9): 2177-2187. |
| [2] | 于逸然, 赖惠成, 高古学, 张过, 彭汪忆楠, 杨龙飞, 黄俊豪. 基于遗传算法和A*算法的多农机协同作业优化方法[J]. 系统仿真学报, 2025, 37(9): 2397-2408. |
| [3] | 倪培龙, 毛鹏军, 王宁, 杨孟杰. 基于改进A-DDQN算法的机器人路径规划[J]. 系统仿真学报, 2025, 37(9): 2420-2430. |
| [4] | 张凯翔, 毛剑琳, 王妮娅, 徐志昊. 针对路径干扰的多机器人分层协作k鲁棒路径规划[J]. 系统仿真学报, 2025, 37(8): 2074-2088. |
| [5] | 陈真, 吴卓屹, 张霖. 深度强化学习中策略表征研究简述[J]. 系统仿真学报, 2025, 37(7): 1753-1769. |
| [6] | 万宇航, 朱子璐, 钟春富, 刘永奎, 林廷宇, 张霖. 基于改进PPO算法的机械臂动态路径规划[J]. 系统仿真学报, 2025, 37(6): 1462-1473. |
| [7] | 叶晨, 邵鹏, 张少平, 李文婷, 周腾明. 面向移动机器人路径规划的增强型人工大猩猩算法[J]. 系统仿真学报, 2025, 37(6): 1474-1485. |
| [8] | 张艳, 李炳华, 霍涛, 刘榕. 融合改进A*算法与DWA算法的机器人动态避障方法研究[J]. 系统仿真学报, 2025, 37(6): 1555-1564. |
| [9] | 伍国华, 曾家恒, 王得志, 郑龙, 邹伟. 基于深度强化学习的四旋翼航迹跟踪控制方法[J]. 系统仿真学报, 2025, 37(5): 1169-1187. |
| [10] | 周晓晖, 李研强, 王勇, 赵德财, 杨逍瑶. 基于双启发式信息蚁群算法的机器人路径规划[J]. 系统仿真学报, 2025, 37(5): 1280-1289. |
| [11] | 喻蝶, 鲍柏仲, 司言, 段暕, 詹小斌, 史铁林. 基于搜索步优化A*算法的移动机器人路径规划[J]. 系统仿真学报, 2025, 37(4): 1041-1050. |
| [12] | 张森, 代强强. 改进型深度确定性策略梯度的无人机路径规划[J]. 系统仿真学报, 2025, 37(4): 875-881. |
| [13] | 李敏, 张森, 曾祥光, 王刚, 张童伟, 谢地杰, 任文哲, 张滔. 基于深度强化学习的四足机器人单腿越障轨迹规划[J]. 系统仿真学报, 2025, 37(4): 895-909. |
| [14] | 贺志刚, 李大焱, 王妮娅, 毛剑琳, 王宁. 一种含链式工作方式的多机器人协作路径规划算法[J]. 系统仿真学报, 2025, 37(4): 953-967. |
| [15] | 王贺, 许佳宁, 闫广宇. 基于深度强化学习的AGV行人避让策略研究[J]. 系统仿真学报, 2025, 37(3): 595-606. |
| 阅读次数 | ||||||
|
全文 |
|
|||||
|
摘要 |
|
|||||