Sm1les %!s(int64=6) %!d(string=hai) anos
pai
achega
5b3e18f6a5
Modificáronse 1 ficheiros con 2 adicións e 2 borrados
  1. 2 2
      docs/chapter16/chapter16.md

+ 2 - 2
docs/chapter16/chapter16.md

@@ -38,9 +38,9 @@ $$
 
 因为
 $$
-\pi(x,a)=P(state=x\mid action=a)
+\pi(x,a)=P(action=a|state=x)
 $$
-表示执行动作a以后出现状态x的概率,又因为动作事件之间两两互斥且和为动作空间,由全概率展开公式
+表示在状态x下选择动作a的概率,又因为动作事件之间两两互斥且和为动作空间,由全概率展开公式
 $$
 P(A)=\sum_{i=1}^{\infty}P(B_{i})P(A\mid B_{i})
 $$