模糊目标聚类

科技工作者之家 2020-11-17

模糊目标聚类(Fuzzy target clustering)是一种聚类方法。它是利用建立在软划分空间上的目标函数进行聚类的一种数学方法。

概念模糊目标聚类(Fuzzy target clustering)是一种聚类方法。它是利用建立在软划分空间上的目标函数进行聚类的一种数学方法。设X={x1,x2,…,xn}是有限集,xi=(xi1,xi2,…,xip),对任何2≤c≤n,以及X的c个子集{Ai: i=1,2,…,c}满足:

则{Ai}成为X的一个硬划分。考虑硬划分的特征函数表达,则:

称为硬划分空间;而:

称为软划分空间。

由xi的特征数据值,便可根据密度、最小平方等,建立软(硬)划分空间上的泛函(目标函数),而这些泛函的极小点即为在该目标下的最佳软(硬)分类。常用的泛函有:

1.密度泛函JR: Mfc→R+;

是固定数,σ是实常数,djk=d(xj,xk)是R中的度量。1

2.最小平方泛函Jm: Mfc×Rcp→R+;

是一软划分,V∈R是聚类中心。

聚类分析聚类分析是多维数据的统计分类方法。它与判别分析的最大差别是事先并不知道所需聚类的各个样本各属何类,甚至分类数也可能未知。因此聚类分析也称为“无师可学”的分类。聚类分析中,首先需要解决分类依据,即什么样的对象比较亲近,从而应该聚成一类;然后是研究把对象分配到各类中的方法。在实践中,由于聚类目的要求不同,分类的准则和方法也可以有差别。设有N个m维样本的数据矩阵

例如,是N个学生的m门功课的成绩。这时可提出如下的分类要求:

1.N个学生如何按成绩分类。

2.学生的哪些门功课的成绩比较相似。

前者的聚类对象为样本(矩阵中的行);后者是变量(列)。为区分二者,依次称为Q型聚类和R型聚类。然而,脱离应用背景,从纯数学考虑,一个矩阵的行、列可由应用者自行定义。所以两型的区分就不是本质的了。为方便,把要聚类的样本或变量统称为聚类对象。

分类的依据是分类对象之间的亲近度。亲近度可以用距离度量,这时,两个分类对象被看成是两个点,距离最近的两个点最亲近。亲近度也可以用相似性(或相关性)来度量,这时,两个分类对象被看做是两个向量,其夹角最小(或相关系数最大)的两个向量最亲近。

最常用的聚类方法是谱系聚类法。开始时,每个对象各成一类,然后把最亲近的两个对象合并为一类.以后的每一步都是从现存的类中,合并最亲近的两类为一类,即每步减少一个类,直至得到所需的类数(或最终只有一个大类)为止。合并过程,包括合并时的亲近程度可绘制成一个谱系聚类图.需要注意的是,一旦有一类内含有多于一个对象,类与类之间的亲近度也有多种意义,从而对应着不同的聚类结果。谱系聚类方法也可以是反向进行的。即先把所有对象都放在一个大类中,然后按一定的准则逐步分割,每步总是把现存类中的某一个分割成两个,直至得到所需类数或每个类都只含一个对象为止。此外,还有动态聚类法和有序样本聚类法等,它们分别适用于分类对象很多和样本的顺序不能变更的聚类场合。2

本词条内容贡献者为:

尹维龙 - 副教授 - 哈尔滨工业大学

科技工作者之家

科技工作者之家APP是专注科技人才,知识分享与人才交流的服务平台。