题目:强化学习中“奖励”机制的主要作用是什么?
A. 调整模型的超参数
B. 评估算法的准确性
C. 指导代理人学习最优策略
D. 提高数据预处理效果
答案:评论后可见此内容
推荐使用我们的公众号搜索题目,题目更全,检索更方便。支持语音、图片、文字等多种搜索方式。