题目:( )是通过智能主体与环境连续交互的过程,学习最优行为策略。
A. 半监督学习
B. 强化学习
C. 监督学习
D. 非监督学习
答案:评论后可见此内容
推荐使用我们的公众号搜索题目,题目更全,检索更方便。支持语音、图片、文字等多种搜索方式。