Browse Source

Merge branch 'datawhalechina:master' into master

Huaqing Xu 3 years ago
parent
commit
456776079a
7 changed files with 47 additions and 30 deletions
  1. 12 6
      README.md
  2. 7 2
      README_french.md
  3. 13 5
      docs/README.md
  4. 8 13
      docs/chapter16/chapter16.md
  5. 1 1
      docs/chapter3/chapter3.md
  6. 6 3
      docs/errata.md
  7. BIN
      res/pumpkin.png

+ 12 - 6
README.md

@@ -1,5 +1,13 @@
-# 南瓜书PumpkinBook
-[简体中文](https://github.com/datawhalechina/pumpkin-book/blob/master/README.md) | [French](https://github.com/datawhalechina/pumpkin-book/blob/master/README_french.md)
+<div align=center>
+<img src="https://raw.githubusercontent.com/datawhalechina/pumpkin-book/master/res/pumpkin.png" >
+<h1>南瓜书PumpkinBook</h1>
+<p>
+<a href="https://github.com/datawhalechina/pumpkin-book/blob/master/README.md">简体中文</a> | <a href="https://github.com/datawhalechina/pumpkin-book/blob/master/README_french.md">Français</a>
+</p>
+<p>
+<strong>配套视频教程:https://www.bilibili.com/video/BV1Mh411e7VU</strong>
+</p>
+</div>
 
 “周志华老师的《机器学习》(西瓜书)是机器学习领域的经典入门教材之一,周老师为了使尽可能多的读者通过西瓜书对机器学习有所了解, 所以在书中对部分公式的推导细节没有详述,但是这对那些想深究公式推导细节的读者来说可能“不太友好”,本书旨在对西瓜书里比较难理解的公式加以解析,以及对部分公式补充具体的推导细节。”
 
@@ -8,8 +16,8 @@
 ## 使用说明
 - 南瓜书的所有内容都是以西瓜书的内容为前置知识进行表述的,所以南瓜书的最佳使用方法是以西瓜书为主线,遇到自己推导不出来或者看不懂的公式时再来查阅南瓜书;
 - 对于初学机器学习的小白,西瓜书第1章和第2章的公式**强烈不建议深究**,简单过一下即可,等你学得有点飘的时候再回来啃都来得及;
-- 每个公式的解析和推导我们都力(zhi)(neng)以本科数学基础的视角进行讲解,所以超纲的数学知识我们通常都会以附录和参考文献的形式给出,感兴趣的同学可以继续沿着我们给的资料进行深入学习;
-- 若南瓜书里没有你想要查阅的公式,或者你发现南瓜书哪个地方有错误,请毫不犹豫地去我们GitHub的Issues( 地址:https://github.com/datawhalechina/pumpkin-book/issues )进行反馈,在对应版块提交你希望补充的公式编号或者勘误信息,我们通常会在24小时以内给您回复,超过24小时未回复的话可以邮件联系我们(微信:at-Sm1les);
+- 每个公式的解析和推导我们都力争以本科数学基础的视角进行讲解,所以超纲的数学知识我们通常都会以附录和参考文献的形式给出,感兴趣的同学可以继续沿着我们给的资料进行深入学习;
+- 若南瓜书里没有你想要查阅的公式,或者你发现南瓜书哪个地方有错误,请毫不犹豫地去我们GitHub的Issues( 地址:https://github.com/datawhalechina/pumpkin-book/issues )进行反馈,在对应版块提交你希望补充的公式编号或者勘误信息,我们通常会在24小时以内给您回复,超过24小时未回复的话可以微信联系我们(微信号:at-Sm1les);
 
 ### 纸质版
 <img src="https://raw.githubusercontent.com/datawhalechina/pumpkin-book/master/res/nangua.jpg" width="300">
@@ -18,8 +26,6 @@
 
 勘误表:https://datawhalechina.github.io/pumpkin-book/#/errata
 
-配套视频教程:https://www.bilibili.com/video/BV1Mh411e7VU
-
 ### 在线阅读(内容实时更新)
 地址:https://datawhalechina.github.io/pumpkin-book
 

+ 7 - 2
README_french.md

@@ -1,5 +1,10 @@
-# PumpkinBook
-[简体中文](https://github.com/datawhalechina/pumpkin-book/blob/master/README.md) | [French](https://github.com/datawhalechina/pumpkin-book/blob/master/README_french.md)
+<div align=center>
+<img src="https://raw.githubusercontent.com/datawhalechina/pumpkin-book/master/res/pumpkin.png" >
+<h1>PumpkinBook</h1>
+<p>
+<a href="https://github.com/datawhalechina/pumpkin-book/blob/master/README.md">简体中文</a> | <a href="https://github.com/datawhalechina/pumpkin-book/blob/master/README_french.md">Français</a>
+</p>
+</div>
 
 “Le livre ‘Machine Learning’ (Watermelon Book) par Prof. Zhihua Zhou est l’un des plus classiques manuels dans le domaine de Machine Learning. Afin des faire connaissances au plus grand nombre de lecteurs possibles à travers de ce livre, Prof. Zhou n’a pas été détaillé des dérivations de certaines formules. Cependant, cela a créé des difficultés pour ce qui voudrais apprendre les détails de ces dérivations. Dans ce cas, ce livre vise à donner des interprétations qui sont plus difficile à comprendre, et aussi compléter des détails de certaines formules.” 
 

+ 13 - 5
docs/README.md

@@ -1,5 +1,13 @@
-# 南瓜书PumpkinBook
-[简体中文](https://github.com/datawhalechina/pumpkin-book/blob/master/README.md) | [French](https://github.com/datawhalechina/pumpkin-book/blob/master/README_french.md)
+<div align=center>
+<img src="https://raw.githubusercontent.com/datawhalechina/pumpkin-book/master/res/pumpkin.png" >
+<h1>南瓜书PumpkinBook</h1>
+<p>
+<a href="https://github.com/datawhalechina/pumpkin-book/blob/master/README.md">简体中文</a> | <a href="https://github.com/datawhalechina/pumpkin-book/blob/master/README_french.md">Français</a>
+</p>
+<p>
+<strong>配套视频教程:https://www.bilibili.com/video/BV1Mh411e7VU</strong>
+</p>
+</div>
 
 “周志华老师的《机器学习》(西瓜书)是机器学习领域的经典入门教材之一,周老师为了使尽可能多的读者通过西瓜书对机器学习有所了解, 所以在书中对部分公式的推导细节没有详述,但是这对那些想深究公式推导细节的读者来说可能“不太友好”,本书旨在对西瓜书里比较难理解的公式加以解析,以及对部分公式补充具体的推导细节。”
 
@@ -8,8 +16,8 @@
 ## 使用说明
 - 南瓜书的所有内容都是以西瓜书的内容为前置知识进行表述的,所以南瓜书的最佳使用方法是以西瓜书为主线,遇到自己推导不出来或者看不懂的公式时再来查阅南瓜书;
 - 对于初学机器学习的小白,西瓜书第1章和第2章的公式**强烈不建议深究**,简单过一下即可,等你学得有点飘的时候再回来啃都来得及;
-- 每个公式的解析和推导我们都力(zhi)(neng)以本科数学基础的视角进行讲解,所以超纲的数学知识我们通常都会以附录和参考文献的形式给出,感兴趣的同学可以继续沿着我们给的资料进行深入学习;
-- 若南瓜书里没有你想要查阅的公式,或者你发现南瓜书哪个地方有错误,请毫不犹豫地去我们GitHub的Issues( 地址:https://github.com/datawhalechina/pumpkin-book/issues )进行反馈,在对应版块提交你希望补充的公式编号或者勘误信息,我们通常会在24小时以内给您回复,超过24小时未回复的话可以邮件联系我们(微信:at-Sm1les);
+- 每个公式的解析和推导我们都力争以本科数学基础的视角进行讲解,所以超纲的数学知识我们通常都会以附录和参考文献的形式给出,感兴趣的同学可以继续沿着我们给的资料进行深入学习;
+- 若南瓜书里没有你想要查阅的公式,或者你发现南瓜书哪个地方有错误,请毫不犹豫地去我们GitHub的Issues( 地址:https://github.com/datawhalechina/pumpkin-book/issues )进行反馈,在对应版块提交你希望补充的公式编号或者勘误信息,我们通常会在24小时以内给您回复,超过24小时未回复的话可以微信联系我们(微信号:at-Sm1les);
 
 ### 纸质版
 <img src="https://raw.githubusercontent.com/datawhalechina/pumpkin-book/master/res/nangua.jpg" width="300">
@@ -65,7 +73,7 @@ PDF版本是我们寄送出版社的全书初稿,经由人民邮电出版社
 | **编委** | [@jbb0523](https://blog.csdn.net/jbb0523) [@juxiao](https://github.com/juxiao) [@Majingmin](https://github.com/Majingmin) [@MrBigFan](https://github.com/MrBigFan) [@shanry](https://github.com/shanry) [@Ye980226](https://github.com/Ye980226) |
 
 ## 致谢
-特别感谢[@awyd234](https://github.com/awyd234)、[@feijuan](https://github.com/feijuan)、[@Ggmatch](https://github.com/Ggmatch)、[@Heitao5200](https://github.com/Heitao5200)、[@huaqing89](https://github.com/huaqing89)、[@LongJH](https://github.com/LongJH)、[@LilRachel](https://github.com/LilRachel)、[@LeoLRH](https://github.com/LeoLRH)、[@Nono17](https://github.com/Nono17)、[@spareribs](https://github.com/spareribs)、[@sunchaothu](https://github.com/sunchaothu)、[@StevenLzq](https://github.com/StevenLzq) 在最早期的时候对南瓜书所做的贡献。
+特别感谢[@awyd234](https://github.com/awyd234)、[@feijuan](https://github.com/feijuan)、[@Ggmatch](https://github.com/Ggmatch)、[@Heitao5200](https://github.com/Heitao5200)、[@xhqing](https://github.com/xhqing)、[@LongJH](https://github.com/LongJH)、[@LilRachel](https://github.com/LilRachel)、[@LeoLRH](https://github.com/LeoLRH)、[@Nono17](https://github.com/Nono17)、[@spareribs](https://github.com/spareribs)、[@sunchaothu](https://github.com/sunchaothu)、[@StevenLzq](https://github.com/StevenLzq) 在最早期的时候对南瓜书所做的贡献。
 
 ## 关注我们
 <div align=center>

+ 8 - 13
docs/chapter16/chapter16.md

@@ -148,19 +148,14 @@ $$
 Q_{t+1}^{\pi}(x,a)=Q_{t}^{\pi}(x,a)+\alpha (R_{x\rightarrow x{}'}^{a}+\gamma Q_{t}^{\pi}(x{}',a{}')-Q_{t}^{\pi}(x,a))
 $$
 
-[推导]:对比公式16.29
-$$
-Q_{t+1}^{\pi}(x,a)=Q_{t}^{\pi}(x,a)+\frac{1}{t+1}(r_{t+1}-Q_{t}^{\pi}(x,a))
-$$
-以及由
-$$
-\frac{1}{t+1}=\alpha
-$$
-可知,若下式成立,则公式16.31成立
-$$
-r_{t+1}=R_{x\rightarrow x{}'}^{a}+\gamma Q_{t}^{\pi}(x{}',a{}')
-$$
-而$r_{t+1}$表示$t+1$步的奖赏,即状态$x$变化到$x'$的奖赏加上前面$t$步奖赏总和$Q_{t}^{\pi}(x{}',a{}')$的$\gamma$折扣,因此这个式子成立。
+[推导]:根据累计折扣奖励的定义(P373)可知:
+
+$$Q_{t+1}^{\pi}(x, a)=\gamma Q_{t}^{\pi}(x', a')+R_{x\to x'}^{a}$$
+
+
+将上式进行类似于公式(16.29)的形式改写,可以得到:
 
 
+$$Q_{t+1}^{\pi}(x, a)= Q_{t}^{\pi}(x, a) + (R_{x\to x'}^{a} + \gamma Q_{t}^{\pi}(x', a') -  Q_{t}^{\pi}(x, a) )$$
 
+括号中的部分即为累计折扣奖励下的需要学习的增量,然后乘以学习率$\alpha$,即可得到公式16.31.

+ 1 - 1
docs/chapter3/chapter3.md

@@ -57,7 +57,7 @@ $$\begin{aligned}
 	&=\underset{(\boldsymbol{w}, b)}{\arg \min } \sum_{i=1}^{m}\left(y_{i}-f\left(\boldsymbol{x}_{i}\right)\right)^{2}\\
 	&=\underset{(\boldsymbol{w}, b)}{\arg \min } \sum_{i=1}^{m}\left(y_{i}-\left(\boldsymbol{w}^\mathrm{T}\boldsymbol{x}_{i}+b\right)\right)^{2}
 \end{aligned}$$
-为便于讨论,我们令$\hat{\boldsymbol{w}}=(\boldsymbol{w};b)=(w_1;...;w_d;b)\in\mathbb{R}^{(d+1)\times 1},\hat{\boldsymbol{x}}_i=(x_1;...;x_d;1)\in\mathbb{R}^{(d+1)\times 1}$,那么上式可以简化为
+为便于讨论,我们令$\hat{\boldsymbol{w}}=(\boldsymbol{w};b)=(w_1;...;w_d;b)\in\mathbb{R}^{(d+1)\times 1},\hat{\boldsymbol{x}}_i=(x_{i1};...;x_{id};1)\in\mathbb{R}^{(d+1)\times 1}$,那么上式可以简化为
 $$\begin{aligned}
 	\hat{\boldsymbol{w}}^{*}&=\underset{\hat{\boldsymbol{w}}}{\arg \min } \sum_{i=1}^{m}\left(y_{i}-\hat{\boldsymbol{w}}^\mathrm{T}\hat{\boldsymbol{x}}_{i}\right)^{2} \\
 	&=\underset{\hat{\boldsymbol{w}}}{\arg \min } \sum_{i=1}^{m}\left(y_{i}-\hat{\boldsymbol{x}}_{i}^\mathrm{T}\hat{\boldsymbol{w}}\right)^{2} \\

+ 6 - 3
docs/errata.md

@@ -1,16 +1,19 @@
 # 纸质版勘误表
 
 如何使用勘误?首先找到你的书的印次,接下来对着下表索引印次,该印次之后所有的勘误都是你的书中所要注意的勘误,印次前的所有勘误在当印次和之后印次均已印刷修正。
-## 第1版第10次印刷(待定)
+## 第1版第12次印刷(待定)
+- 式(3.9)中$\hat{\boldsymbol{x}}_i=(x_{1};...;x_{d};1)\in\mathbb{R}^{(d+1)\times 1}$改为$\hat{\boldsymbol{x}}_i=(x_{i1};...;x_{id};1)\in\mathbb{R}^{(d+1)\times 1}$(感谢@Link2Truth)
 
+## 第1版第11次印刷(2022.03)
+## 第1版第10次印刷(2021.12)
 - 式(10.2)解释的最后一行,最后一个式子因为$1 + P^2\left(c^{*} | \boldsymbol{x}\right)\leqslant 2$改为$1 + P\left(c^{*} | \boldsymbol{x}\right)\leqslant 2$
 
 ## 第1版第9次印刷(2021.11)
 ## 第1版第8次印刷(2021.10)
 ## 第1版第7次印刷(2021.10)
 - 92页,式(10.28),“$n$行1列的单位向量”改为“$n$行1列的元素值全为1的向量”
-- 95页,式(11.6),“...降低因$w$的分量过太而导致...”改为“...降低因$w$的分量过大而导致...”(感谢微信@李伟豪work hard)
-- 式(11.18),求和可得下面的公式中第一行关于$\boldsymbol{b}$的列向量有笔误,最新表述参见:https://datawhalechina.github.io/pumpkin-book/#/chapter11/chapter11?id=_1118 (感谢微信@@李伟豪work hard)
+- 95页,式(11.6),“...降低因$w$的分量过太而导致...”改为“...降低因$w$的分量过大而导致...”(感谢@李伟豪work hard)
+- 式(11.18),求和可得下面的公式中第一行关于$\boldsymbol{b}$的列向量有笔误,最新表述参见:https://datawhalechina.github.io/pumpkin-book/#/chapter11/chapter11?id=_1118 (感谢@李伟豪work hard)
 
 ## 第1版第6次印刷(2021.07)
 - 17页,式(3.37),最后解析$\lambda$的取值那部分不太严谨,最新表述参见:https://datawhalechina.github.io/pumpkin-book/#/chapter3/chapter3?id=_337

BIN
res/pumpkin.png