解释一下强化学习中的bellman公式,以及其与微积分的关系

视频信息