- 发布时间
- 13分钟48秒
- 上海 · 阴
多智能体路径规划与强化学习术语整理
整理自日常学习笔记,覆盖 MAPF、CBS、A*、D* Lite、MARL、MDP、DQN、PPO、CTDE、GNN 等多智能体路径规划与强化学习核心概念。从单机路径规划到多机器人协同调度,再到多智能体强化学习优化的完整技术路线。
Read Full Post →随笔 · 学习 · 项目实践
Kieran Space:记录技术学习、项目实践和个人随笔的数字空间。这里会持续整理正在学习的内容、遇到的问题,以及一些值得回看的想法。
整理自日常学习笔记,覆盖 MAPF、CBS、A*、D* Lite、MARL、MDP、DQN、PPO、CTDE、GNN 等多智能体路径规划与强化学习核心概念。从单机路径规划到多机器人协同调度,再到多智能体强化学习优化的完整技术路线。
Journal Archive
整理自日常学习笔记,覆盖 MAPF、CBS、A*、D* Lite、MARL、MDP、DQN、PPO、CTDE、GNN 等多智能体路径规划与强化学习核心概念。从单机路径规划到多机器人协同调度,再到多智能体强化学习优化的完整技术路线。
Read Full Post →强化学习课程笔记原文整理,覆盖基础概念、MDP 与价值函数、动态规划与蒙特卡罗、TD/Sarsa/Q-Learning、函数近似、DQN 与策略梯度。
Read Full Post →