题目:下列关于强化学习与监督学习的论述,说法正确的是( )
A. 监督学习有标记样本,强化学习没有标记样本
B. 强化学习中的“策略”实际上就相当于监督学习中的“分类器”或“回归器”
C. 强化学习和监督学习是两种完全不同的学习⽅式,彼此之间⽆法构成联系
D. 强化学习任务的⽬的是找到能使⻓期累积奖励最⼤化的策略
答案:评论后可见此内容
推荐使用我们的公众号搜索题目,题目更全,检索更方便。支持语音、图片、文字等多种搜索方式。