|
|
@@ -28,7 +28,7 @@ JC=\frac{M_{11}}{M_{11}+M_{10}+M_{01}}
|
|
|
$$
|
|
|
由于聚类属于无监督学习,事先并不知道聚类后样本所属类别的类别标记所代表的意义,即便参考模型的类别标记意义是已知的,我们也无法知道聚类后的类别标记与参考模型的类别标记是如何对应的,况且聚类后的类别总数与参考模型的类别总数还可能不一样,因此只用单个样本无法衡量聚类性能的好坏。
|
|
|
|
|
|
-由于外部指标的基本思想就是以参考模型的类别划分为参照,因此如果某一个样本对中的两个样本在聚类结果中同属于一个类,在参考模型中也同属于一个类,那么对于这两个样本来说这是一个好的聚类结果。
|
|
|
+由于外部指标的基本思想就是以参考模型的类别划分为参照,因此如果某一个样本对中的两个样本在聚类结果中同属于一个类,在参考模型中也同属于一个类,或者这两个样本在聚类结果中不同属于一个类,在参考模型中也不同属于一个类,那么对于这两个样本来说这是一个好的聚类结果。
|
|
|
|
|
|
总的来说所有样本对中的两个样本共存在四种情况:<br>
|
|
|
1、样本对中的两个样本在聚类结果中属于同一个类,在参考模型中也属于同一个类;<br>
|