## 7.5 $$R(c|\boldsymbol x)=1−P(c|\boldsymbol x)$$ [推导]:由式7.1和式7.4可得: $$R(c_i|\boldsymbol x)=1*P(c_1|\boldsymbol x)+1*P(c_2|\boldsymbol x)+...+0*P(c_i|\boldsymbol x)+...+1*P(c_N|\boldsymbol x)$$ 又$\sum_{j=1}^{N}P(c_j|\boldsymbol x)=1$,则: $$R(c_i|\boldsymbol x)=1-P(c_i|\boldsymbol x)$$ 此即为式7.5 ## 7.17-7.18 $$P_{(\boldsymbol x_{i}|c)}\in[0,1]$$ $$p_{(\boldsymbol x_{i}| c)}$$ [解析]:式(7.17)所得$P_{(\boldsymbol x_{i}|c)}\in[0,1]$为条件概率,但式(7.18)所得$p_{(\boldsymbol x_{i}| c)}$为条件概率密度而非概率,其值并不在局限于区间[0,1]之内。 ## 7.23 $$P(c|\boldsymbol x)\propto{\sum_{i=1 \atop |D_{x_{i}}|\geq m'}^{d}}P(c,x_{i})\prod_{j=1}^{d}P(x_j|c,x_i)$$ [推导]: $$\begin{aligned} P(c|\boldsymbol x)&=\cfrac{P(\boldsymbol x,c)}{P(\boldsymbol x)}\\ &=\cfrac{P\left(x_{1}, x_{2}, \ldots, x_{d}, c\right)}{P(\boldsymbol x)}\\ &=\cfrac{P\left(x_{1}, x_{2}, \ldots, x_{d} | c\right) P(c)}{P(\boldsymbol x)} \\ &=\cfrac{P\left(x_{1}, \ldots, x_{i-1}, x_{i+1}, \ldots, x_{d} | c, x_{i}\right) P\left(c, x_{i}\right)}{P(\boldsymbol x)} \\ \end{aligned}$$ $$\begin{aligned} P(c|\boldsymbol x)&\propto P(c,x_{i})P(x_{1},…,x_{i-1},x_{i+1},…,x_{d}|c,x_{i}) \\ &=P(c,x_{i})\prod _{j=1}^{d}P(x_j|c,x_i) \end{aligned}$$ $$P(c|\boldsymbol x)\propto{\sum_{i=1 \atop |D_{x_{i}}|\geq m'}^{d}}P(c,x_{i})\prod_{j=1}^{d}P(x_j|c,x_i)$$ 此即为式7.23,由于式(7.24)和式(7.25)的使用到了$|D_{c,x_{i}}|$与$|D_{c,x_{i},x_{j}}|$,若$|D_{x_{i}}|$集合中样本数量过少,则$|D_{c,x_{i}}|$与$|D_{c,x_{i},x_{j}}|$将会更小,因此在式(7.23)中要求$|D_{x_{i}}|$集合中样本数量不少于$m'$。 ## 附录 ### 勘误 7.3节例子计算有笔误,第152页的第9个等式应为$P_{(凹陷|\boldsymbol 是)}=\cfrac{5}{8}$。截止到目前(第28次印刷),西瓜书官方勘误修订仅在第8次印刷时修正了第3个等式$P_{(蜷缩|\boldsymbol 是)}$,但第9个等式仍未修正(若修正第84页的西瓜数据集3.0也可,但亦未修正)。 #### sklearn调包 ```python import numpy as np X = np.array([[-1, -1], [-2, -1], [-3, -2], [1, 1], [2, 1], [3, 2]]) Y = np.array([1, 1, 1, 2, 2, 2]) from sklearn.naive_bayes import GaussianNB clf = GaussianNB() clf.fit(X, Y) GaussianNB(priors=None, var_smoothing=1e-09) print(clf.predict([[-0.8, -1]])) ``` #### 参数: priors : array-like, shape (n_classes,) Prior probabilities of the classes. If specified the priors are not adjusted according to the data. var_smoothing : float, optional (default=1e-9) Portion of the largest variance of all features that is added to variances for calculation stability. #### 贝叶斯应用 1. 中文分词 分词后,得分的假设是基于两词之间是独立的,后词的出现与前词无关 2. 统计机器翻译 统计机器翻译因为其简单,无需手动添加规则,迅速成为了机器翻译的事实标准。 3. 贝叶斯图像识别 首先是视觉系统提取图形的边角特征,然后使用这些特征自底向上地激活高层的抽象概念,然后使用一个自顶向下的验证来比较到底哪个概念最佳地解释了观察到的图像。