默认的 Kubernetes 调度器在通用工作负载上表现出色,但对于分布式强化学习(RL)这类通信密集型任务,其标准的 Pod 打散策略往往会成为性能瓶颈。一个典型的 RL 训练作业通常包含一个参数服务器或协调器(Master)和多个执行环
2023-10-27