摘 要:针对自动驾驶中复杂跟驰场景,提出了一种基于优先经验回放的双延迟深度确定性策略梯度(TwinDelayedDeepDeterministicPolicyGradientwithPrioritizedExperienceReplay,TD3-PER)算法的车辆跟驰控制策略。该策(试读)...