题目:() 从(状态,动作)到状态的映射,决定不同状态之间的转移概率。
A. 策略
B. 环境模型
C. 即时奖励
D. 价值函数
答案:评论后可见此内容
推荐使用我们的公众号搜索题目,题目更全,检索更方便。支持语音、图片、文字等多种搜索方式。