Skip to content

Latest commit

 

History

History
6 lines (4 loc) · 314 Bytes

readme.md

File metadata and controls

6 lines (4 loc) · 314 Bytes

RL_IoT_distillation:

实验记录:

12.06: 复现初步部分 policy distillation思想的论文,剩下三个todo,后续完善。正在跑自己的distillation,然后第二台服务器跑vanilla DQN 今天对比了一下 test 100 比 30 大概与环境 collect 1M次,慢了50min,接近一个h。