浏览代码

fix 16.31

Sm1les 5 年之前
父节点
当前提交
7fb9aa4436
共有 1 个文件被更改,包括 1 次插入1 次删除
  1. 1 1
      docs/chapter16/chapter16.md

+ 1 - 1
docs/chapter16/chapter16.md

@@ -160,7 +160,7 @@ $$
 $$
 r_{t+1}=R_{x\rightarrow x{}'}^{a}+\gamma Q_{t}^{\pi}(x{}',a{}')
 $$
-而由γ折扣累积奖赏可估计得到。
+而由$\gamma$折扣累积奖赏可估计得到。