DVUPU这个人很懒,什么都没有留下~ 1 文章 0 评论 0 粉丝 关注私信 文章 评论 问答 关注 收藏 Bandit算法——让机器学会动态决策 一、什么是Bandit算法 Bandit算法是通过不断尝试并学习结果来达到最优决策的一种算法。它属于强化学习的范畴,主要应用于动态决策问题中,例如推荐系统、广告投放等领域。 以广告… DVUPU 编程 2025-04-24 点击查看更多