题目:( )的目标是获得一个策略去指导行动,会从一个初始策略开始,在学习过程中,主体通过行动和环境进行交互来产生新的数据,不断获得反馈,并通过反馈优化策略,是一种强大的学习方式。( )
A. 有监督学习
B. 无监督学习
C. 半监督学习
D. 强化学习
答案:评论后可见此内容
推荐使用我们的公众号搜索题目,题目更全,检索更方便。支持语音、图片、文字等多种搜索方式。