2012年10月30日星期二

模式识别 by 汪增福 : 聚类分析笔记

一个好的相似性测度应该具有某些不变特性。

例如,它应该对样本观测空间中的平移、旋转和尺度变化是不敏感的。

例如欧氏距离对平移和旋转变化是不变的,但不是尺度变换和一般线性变换下的不变量。因此,当把欧氏距离作为相似性度量时,特征量单位/量纲的选择非常重要。

聚类算法的性能好坏一般与以下因素相关:

  • 聚类中心的选择与更新

  • 聚类策略和聚类准则(函数)的选择

  • 控制阈值和类别数的设置

没有评论:

发表评论