题目:在马尔科夫过程中使用动态规划,根据bellman公式,一个状态的价值为改状态的即时奖励和该状态的后继状态的价值的()。
A. 差
B. 积
C. 和
D. 商
答案:评论后可见此内容
推荐使用我们的公众号搜索题目,题目更全,检索更方便。支持语音、图片、文字等多种搜索方式。