DVUPU
DVUPU的头像

DVUPU

这个人很懒,什么都没有留下~
1 文章
0 评论
0 粉丝
  • Bandit算法——让机器学会动态决策

    一、什么是Bandit算法 Bandit算法是通过不断尝试并学习结果来达到最优决策的一种算法。它属于强化学习的范畴,主要应用于动态决策问题中,例如推荐系统、广告投放等领域。 以广告…

    编程 2025-04-24
点击查看更多