等距特征映射

科技工作者之家 2020-11-17

等距特征映射(Laplacian Eigenmaps)使用频谱技术来执行降维。该技术依赖于基本假设,即数据位于高维空间中的低维流形中。该算法不能嵌入样本点,但是存在基于再生核Hilbert空间正则化的技术来增加这种能力。这些技术也可以应用于其他非线性降维算法。

介绍主成分分析等传统技术不考虑数据的内在几何。拉普拉斯算子特征映射根据数据集的邻域信息构建图形。每个数据点用作图上的节点,并且节点之间的连接由相邻点的接近度控制(使用例如k-最近邻居算法)。由此生成的图可以被认为是高维空间中的低维流形的离散近似。基于该图最小化成本函数确保在歧管上彼此接近的点在低维空间中彼此靠近地映射,从而保持局部距离。拉普拉斯 - 贝尔特拉米算子在流形上的本征函数用作嵌入维数,因为在温和条件下,该算子具有可计数的谱,该谱是流形上的平方可积函数的基础(与单位圆流形上的傅里叶级数相比)。试图将拉普拉斯特征映射置于坚实的理论基础上已经取得了一些成功,因为在某些非限制性假设下,随着点数变为无穷大,图拉普拉斯矩阵已经显示收敛到拉普拉斯 - 贝尔特拉米算子。Laplacian Eigenmaps的Matlab代码可以在算法中找到,Belkin的博士论文可以在俄亥俄州立大学找到。

应用在分类应用中,低维流形可用于建模数据类,这些数据类可以从观察到的实例组中定义。每个观察到的实例可以用两个独立因素来描述,称为“内容”和“风格”,其中“内容”是与类本质相关的不变因子,“风格”表示实例之间该类的变化。不幸的是,当训练数据包括在风格方面变化很大的实例时,拉普拉斯特征图可能无法产生感兴趣类的连贯表示。在由多元序列表示的类的情况下,已经提出结构拉普拉斯特征映射来通过在拉普拉斯算子特征映射邻域信息图中添加附加约束来更好地反映该类的内在结构来克服该问题1。更具体地,该图用于编码多变量序列的顺序结构,并且如果其包含重复,则用于最小化风格变化,不同序列的数据点之间或甚至在序列内的接近度。使用动态时间扭曲,通过找到表现出高相似性的多变量序列的部分之间和之内的对应关系来检测接近度。在基于视觉的活动识别,面向对象分类和人体3D姿势恢复应用上进行的实验已经证明了在处理多变量序列数据时结构拉普拉斯特征图的附加值。结构拉普拉斯特征图的扩展,广义拉普拉斯特征图导致了流形的产生,其中一个维度特别代表风格的变化。事实证明,这在跟踪人体关节体和轮廓提取等应用中尤为重要。

本词条内容贡献者为:

王沛 - 副教授、副研究员 - 中国科学院工程热物理研究所

科技工作者之家

科技工作者之家APP是专注科技人才,知识分享与人才交流的服务平台。