@@ -160,7 +160,7 @@ $$
$$
r_{t+1}=R_{x\rightarrow x{}'}^{a}+\gamma Q_{t}^{\pi}(x{}',a{}')
-而由γ折扣累积奖赏可估计得到。
+而由$\gamma$折扣累积奖赏可估计得到。