QTOFA
QTOFA的头像

QTOFA

这个人很懒,什么都没有留下~
1 文章
0 评论
0 粉丝
  • 探究Off-Policy的使用

    一、Off-Policy的概述 Off-Policy是一种强化学习算法,其在现实世界中广泛应用。在Off-Policy的算法中,我们从数据集中学习政策,但我们的操作又不会影响环境,…

    编程 2025-02-27
点击查看更多