|
|
@@ -1,7 +1,7 @@
|
|
|
### 7.5
|
|
|
$$R(c|\boldsymbol x)=1−P(c|\boldsymbol x)$$
|
|
|
[推导]:由式7.1和式7.4可得:
|
|
|
-$$R(c_i|\boldsymbol x)=1*P(c_1|\boldsymbol x)+1*P(c_2|\boldsymbol x)+...+0*P(c_i|\boldsymbol x)+...+1*P(c_N|\boldsymbol x)$$
|
|
|
+$$R(c_i|\boldsymbol x)=1\*P(c_1|\boldsymbol x)+1\*P(c_2|\boldsymbol x)+...+0\*P(c_i|\boldsymbol x)+...+1\*P(c_N|\boldsymbol x)$$
|
|
|
又$\sum_{j=1}^{N}P(c_j|\boldsymbol x)=1$,则:
|
|
|
$$R(c_i|\boldsymbol x)=1-P(c_i|\boldsymbol x)$$
|
|
|
此即为式7.5
|
|
|
@@ -12,7 +12,7 @@ $$P(c|\boldsymbol x)=\cfrac{P(c)P(\boldsymbol x|c)}{P(\boldsymbol x)}$$
|
|
|
$P(\boldsymbol x)$可以省略,因为我们比较的时候$P(\boldsymbol x)$一定是相同的,所以我们就是用历史数据计算出$P(c)$和$P(\boldsymbol x|c)$。
|
|
|
1. $P(c)$根据大数定律,当样本量到了一定程度且服从独立同分布,c的出现的频率就是c的概率。
|
|
|
2. $P(\boldsymbol x|c)$,因为$\boldsymbol x$在这里不对单一元素是个矩阵,涉及n个元素,不太好直接统计分类为c时,$\boldsymbol x$的概率,所以我们根据假设独立同分布,对每个$\boldsymbol x$的每个特征分别求概率
|
|
|
-$$P(\boldsymbol x|c)=P(x_1|c)*P(x_2|c)*P(x_3|c)...*P(x_n|c)$$
|
|
|
+$$P(\boldsymbol x|c)=P(x_1|c)\*P(x_2|c)\*P(x_3|c)...\*P(x_n|c)$$
|
|
|
这个式子就可以很方便的通过历史数据去统计了,比如特征n,就是在分类为c时特征n出现的概率,在数据集中应该是用1显示。
|
|
|
但是当某一概率为0时会导致整个式子概率为0,所以采用拉普拉斯修正
|
|
|
|