点击图片上方蓝色字体“慧天地”即可订阅
2019山东省地理信息产业大会将于10月31日上午在青岛国际会展中心开幕,关注会议日程及分论坛一报告内容,请点击以下链接文字查阅:
作者信息
刘晓琴1,2,3,侯妙乐1,2,董友强1,2,汪万福4,吕书强1,2
(1. 北京建筑大学 北京未来城市设计高精尖创新中心,北京 100044;2. 北京市建筑遗产精细重构与健康监测重点实验室,北京 100044;3. 北京水保生态工程咨询有限公司,北京 100055;4. 敦煌研究院,甘肃 730000)
【摘要】瞿昙寺因寺内所藏巨幅彩色壁画而闻名,但由于受到自然因素及人为因素的影响,寺内51间壁画廊中有些壁画已经发生褪色、龟裂、卷翘、起甲、颜料层脱落等病害,尤其是颜料层一旦脱落,对于不可再生的壁画来说,损失无法弥补。因此在壁画的保护修复过程中,对壁画病害的识别与评估就变得十分关键。以瞿昙寺西回廊的高光谱图像数据为研究数据,利用支持向量机(Support Vector Machine,SVM)方法对壁画病害识别分类;以此提取的病害矢量数据为基础,构建壁画病害的评估指标要素,进而提出基于多元统计回归的LS-SR-AIC评估模型,实现壁画病害严重程度的评估。实验结果表明:利用该方法颜料层脱落病害的SVM提取精度达95%以上,同时为颜料层脱落病害工程评价提供了一种新的方法指导,为文物的健康评价走向定量化评估提供参考与借鉴。
【关键词】壁画病害;颜料层脱落;高光谱;指标要素;回归分析
【中图分类号】TP27
【文献标识码】A
【文章编号】1672-1586(2019)05-0022-07
引文格式:刘晓琴,侯妙乐,董友强,等. 基于高光谱影像的瞿昙寺壁画颜料层脱落病害评估[J].地理信息世界,2019,26(5):22-28.
正文
0 引 言
壁画文化是我国文化遗产不可或缺的一角,其承载的丰富艺术信息有利于考古学家深入挖掘历史发展轨迹和文化发展状态,可以从不同角度折射出各时期的经济发展状况和意识形态。但由于自然因素和人为因素的存在(虽然人为破坏已经被制止),壁画的生存现状一直令人堪忧,由于生存环境中温湿度的影响,壁画往往经受着多种病害,包括颜料层脱落、酥碱、烟熏、起甲、空鼓、裂隙、微生物和霉变等20多种病害。壁画文物因为颜料层起翘、鳞片状起甲以及胶结力的失去,时间一久颜料层慢慢脱落,致使遗失部分无法复原。传统的壁画病害实地临摹效率和时长都不足以实现工程需求,后来出现的摄影技术无法避免壁画图像的色彩失真,复制的信息会随着时间的流逝而遗失,而采用近代计算机新技术不仅可以很好地避免传统技术的缺陷还能提高效率。
高光谱成像技术是一种融合了图像和光谱信息的新技术,该技术具有非接触、无损、无污染、高效等优点,非常适合历史壁画的病害检查,也广泛用于植物生长状态的病害程度监测、果蔬品质与安全无损检测、艺术品鉴定、血迹识别检测、黑色中性笔字迹检测等方面。随着高光谱技术在文物界的发展,该技术逐渐应用在古画颜料分析、古书画隐含信息挖掘、古壁画虚拟修复和信息增强等古书画壁画文物研究领域,但目前在文物的病害分析方面研究较少。
本文基于瞿昙寺壁画西回廊成像光谱数据,利用计算机技术实现壁画的颜料层脱落病害的提取,对壁画的保存现状有一个清晰的认识,利用高光谱成像技术非接触式且无破坏性的优势,快速识别出病害并呈现病害的分布位置,实现壁画病害的空间可视化和壁画病害位置的虚拟展示,为后期壁画的病害严重程度的评价工作奠定基础。
1 实验数据与预处理
1.1 高光谱图像获取
本文的壁画实验数据采集于瞿昙寺西回廊,壁画内容主要以佛教人物的故事为主,作为明清时代的艺术品,其建筑、雕刻和绘画艺术无不彰显着瞿昙寺深厚的考古价值和艺术价值。遗憾的是,在数据采集过程中发现壁画上有多处颜料层脱落病害的存在,脱落部分的缺失影响了壁画完整信息的呈现。采集过程中需要注意,高光谱成像数据可能会出现同一病害位于不同位置,会因为光照环境和相机摆放位置不同而影响数据的灰度值,故采集数据时需综合考虑壁画的所处环境。获取点状光谱数据所用仪器由美国ASD(Analytical Spectral Device,ASD)公司生产的一款便携式地物波谱仪,如图1所示,仪器相关参数见表1。获取成像光谱数据所用的仪器是高光谱成像光谱仪,如图2所示,仪器的相关参数见表2。
图1 ASD地物波谱仪
Fig.1 Analytical spectral device
表1 ASD地物波谱仪相关参数
Tab.1 Instrument parameters
图2 高光谱成像光谱仪
Fig.2 Hyperspectral imaging spectrometer
表2 高光谱成像光谱仪相关参数
Tab.2 Hyperspectral imaging spectrometer parameters
1.2 高光谱图像预处理
1.2.1 辐射校正
本文实验中对采集的高光谱数据需要辐射校正预处理,校正的方法是通过仪器采集暗电流数据与标准白板数据实现反射率反演。白板数据就是扫描反射率为100%的标准白板图像得到全白的标定图像数据,暗电流数据是同等光照条件下密闭光箱(关闭电源卤素灯,镜头盖住高光谱相机)得到的反射率为0的全黑标定图像数据,其辐射校正的公式为(1):
式中,ref——校正后数据反射率;data——实验采集数据反射率;white——白板数据反射率;dark——暗电流数据反射率。
1.2.2 图像去噪
高光谱图像数据主要利用成像光谱仪采集不同光谱范围内连续光谱信息的壁画空间信息,研究所用数据具有1040个波段,不仅波段数量丰富,而且各像元的波段信息连续,富含目标物体的空间信息以及目标在不同波段的隐含信息。但是波段信息丰富的同时也出现了大量的重复信息,增加了波段间数据的冗余度,给数据的处理带来了不便。为了解决高光谱数据多波段数据间相互干扰的问题,常用最小噪声分离(Minimum Noise Fraction,MNF)与主成分分析法(Principal Components Analysis,PCA)实现高维数据降维和特征提取。
本文使用的影像数据包含1 040个波段,涵盖从377.448 4nm~1 033.095 nm波长范围,波段间隔0.58nm的光谱。通过对影像数据的观察,前50波段与后50波段噪声非常大,故只选择50~990内的波段进行计算,然后对预处理后的图像进行MNF变换。经过最小噪声分离正变换和逆变换处理后的影像不仅能够保留光谱信息,而且能够很好地抑制影像中的噪声。如图3所示为图像去噪过程,如图4所示为图像辐射校正后与MNF逆变换的噪声对比示意图,上面的光谱曲线中存在明显噪声,下面经过MNF逆变换之后噪声得到去除。
图3 图像去噪
Fig.3 Noise reduction of images
a 原始影像光谱曲线
a Original image
b 图像MNF逆变换光谱曲线
b Inverse MNF image
图4 原始图像与MNF逆变换后的噪声对比图
Fig.4 Noise contrast between the original image and inverse MNF image
2 壁画颜料层脱落病害信息提取
壁画颜料层脱落病害信息的数字化提取对于壁画病害的评价与修复都有着极为重要的现实意义,传统方法直接取样与壁画直接接触造成了壁画的二次伤害且效率较低,AutoCAD人工勾绘又增加了工作量且误差明显。本文利用图像的高光谱特征和高光谱图像的“图谱合一”特征建立训练样本,为病害的提取以及定量化奠定基础,基于SVM(Support Vector Machine,SVM)的脱落病害信息提取流程如图5所示。
图5 技术流程图
Fig.5 The technical flow
2.1 样本ROI提取
训练样本的选择要确保每一类别的代表性,选择的ROI分布位置均匀;考虑到研究区域的形状、均一性等问题来确定样本量。在已确定训练样本量的前提下,通过讨论样本的空间相关性来降低样本的聚集性,以减少由此带来的精度评定过高的现象。同时,为确保样本的代表性,尽可能保证样本的空间覆盖性;对照分类前高光谱图像,主要通过目视解译的方式确定训练样本点的不同地类要素的类别。
2.2 颜料层脱落区域提取
本文对7个实验区域采用SVM提取脱落病害信息,SVM采用不同的核函数可以实现不同的学习机器。常见的SVM非线性核函数有多项式核函数、径向基核函数和神经网络核函数(Sigmoid核函数)。通过目视对影像的颜色、纹理、形状等特征进行分析,设置核函数类型、分类等级、分类概率阈值等,利用实验结果的优良来确定特征是否需要变更。实验证明更多空间特征的融入对光谱特征有很好的约束,可以提高SVM分类准确度。
2.3 精度评定
针对大数据量的样本,结合已有的壁画颜料的不同类别作为先验知识,对样本点的真实属性进行半自动化识别(样本属性识别);根据样本属性及对应壁画的分类类别,构建误差矩阵,在此基础上,计算提取病害的总体精度、制图精度、用户精度、Kappa系数、漏分误差、错分误差等指标来综合评定壁画颜料层脱落病害的提取精度(精度评定指标)。本文采用confusionmatrix的总体分类精度、Kappa系数值进行精度指标的评定。
3 壁画颜料层脱落指数分析
壁画颜料层脱落病害评估是对壁画进行科学保护、管理和利用的一项基础性工作,在壁画病害防治的实际工作中,一个能够量化表达病害发生严重情况的方法,能使各个文保部门和社会组织更好地了解不同病害实际发生的动态,进而有组织性和指导性地实施病害防治工作。本文提出了一种新的评价壁画严重程度等级评估——颜料层脱落指数的分析方法,很好地实现了病害从定性化研究向定量化研究过渡。
3.1 颜料层脱落病害区域等级划分
依据壁画颜料层脱落病害的不同状态划分为脱落不严重、脱落轻微严重、脱落比较严重和脱落完全4个等级。并采用0~100之间的分值代表颜料层脱落的严重程度来进行量化,见表3。其中颜料层脱落不严重为状态1,使用≥70表示;轻微脱落为状态2,使用60~69表示;比较严重为状态3,使用50~59表示;脱落完全为状态4,使用<50 表示。
表3 等级划分
Tab.3 Division level
3.2 指标要素选取
以颜料层脱落病害的指标要素选择为研究对象,虽然人眼能看出壁画破损脱落的严重程度,仍然需要一种比人类视觉更有效的评估脱落水平的方法来评估这些保护和增强技术,这也将有助于研究人员确定以往的保护措施是否仍然有效或是否会造成新的损害。为了分析壁画颜料层脱落病害的严重程度,需要选取影响壁画现状条件的相关评价指标,习惯上利用病害数量、病害面积等因素直接反映病害发生的严重程度,但这些表述有一定直观性的同时又有一定的局限性。所以本文提出综合病害面积、数量、密度和美观度4个方面集一体的壁画颜料层脱落病害指数,来探索并改进目测经验判定病害状况和病害程度的量化方法。
3.2.1 病害破损率指数
病害破损面积反映了病害发生的广度,是衡量壁画病害发生范围的关键因素,病害范围的统计因区域而异,因此不同幅面统计出来的结果不是很科学,于是对整个瞿昙寺壁画引入了破损率指数(Damage Rate Index,DRI),公式如式(2)。即病害发生的面积占实验所在壁画总体面积的比率,用来衡量当时病害发生的普遍程度。调查统计以单幅壁画或特定研究区域为实验范围,单位面积内颜料层脱落病害的破损率越高,对壁画脱落程度越大。
式中,Ai代表每块颜料层病害面积,A 代表实验样区的壁画面积,DRI取值大于0。
3.2.2 病害斑块密度指数
病害发生密度是反映壁画破损严重程度的衡量指标之一。根据病害种类、壁画本身质地及病害类型的危害范围等特点,描述其状态因人而异,如每平方米的密度、每一幅的密度和每一景的密度(按采集类型)等,于是引入病害斑块密度指数(Density Index,DI),即单位面积上壁画颜料层脱落病害的数量,公式如式(3)。病害斑块密度作为分析病害空间性的基本指标,描述的是病害的破碎化程度,该指标值越大,壁画的脱落受损程度也就越大。
式中,N代表脱落病害的数量,A代表实验样区的壁画面积,DI取值范围大于0。
3.2.3 病害边界密度指数
病害边界密度指数(Boundary Density Index,BDI),是指单位面积内含有的病害斑块边界的长度,公式如式(4)。该指标作为分析病害形状的基本指标,反映着病害边界特征的复杂程度。颜料层脱落病害的边界越是复杂多样化,越是影响壁画的完整程度,影响壁画细节内容的完美呈现。
式中,E代表病害斑块的边界总长,A代表实验样区壁画面积,BDI取值大于0。
3.2.4 病害破碎度指数
壁画颜料层脱落破碎度(Fragmentation Index,FI)表征壁画被病害分割的破碎化程度,代表着环境影响及人为影响的干扰程度,与自然保护单位的规范管理制度密切相关,公式如式(5),该指标考量的是壁画整体艺术美观度,通过视觉特征来感知壁画质量的主观价值。
式中,Ni为病害i的斑块数量,AP为壁画病害i的平均脱落病害面积,FI取值大于0。
3.3 评价模型建立
在壁画的病害识别与保护的实际问题中,影响壁画整体价值的因素复杂多变且多维度,而利用多元回归分析方法可以很好地诠释单一病害的多指标因素对壁画价值评估的影响。本文建立多元回归分析的基本思想就是以病害破损率指数(DRI)、病害斑块密度指数(DI)、病害边界密度指数(BDI)和病害破碎度指数(FI)为影响壁画破损严重程度的4个指标,对传统依靠人为主观判断壁画受损程度的分析提出一种综合性评价的方法,利用R语言多元回归分析将基于专家经验的定性分析与定量分析综合,实现壁画现状的健康评估。本文提出的评价模型建立步骤如下:
1)根据壁画现状的整体破损程度赋予y值,分别按照≥70表示状态1,用60~69表示状态2,用50~59表示状态3,用<50 表示状态4;
2)根据提取的颜料层脱落病害数据,利用ENVI软件获取所有实验区提取的颜料层脱落病害区域的矢量数据或生成TIFF格式;
3)采用ArcGIS软件统计分析得到各个实验区的颜料层脱落病害的面积、数量和边长等数据,并将获取的数据用于4个指标要素的解算中,生成结果置于Excel表格;
4)在R语言中安装数据包,读取Excel数据表,然后多指标要素利用lm()函数构建多元回归模型,如:y=β0+β1DRI +β2DI +β3BDI +β4FI +u,其中y为因变量,β0为偏回归系数,βi为回归参数,u为残差,进一步分析壁画颜料层脱落病害的严重程度与关键指标之间的关系;
5)对回归模型进行显著性检验,诊断回归模型和回归参数的显著性。通过逐步回归模型调整来消除共线性,利用AIC准则获取最优模型。
4 实验结果与分析
4.1 颜料层脱落病害提取实验
以人工选择感兴趣目标为训练样本,采用支持向量机法进行病害信息的提取,其提取的结果如图6所示,颜料层脱落病害在原始影像中为白色,其中红色表示SVM提取的颜料层脱落病害。图6中a1、b1、c1和d1分别为实验样本1、样本2、样本3和样本4,图6中a2、b2、c2和d2分别为样本1、样本2、样本3和样本4对应的SVM分类结果图像,图6中a3、b3、c3和d3分别为样本1、样本2、样本3和样本4提取的颜料层脱落病害。
图6 不同实验区病害区域提取效果
Fig.6 Extraction results of disease areas in different experimental areas
在颜料层脱落病害提取中,通过对同一区域数据实验提取病害进行对比分析,并计算总体分类精度、Kappa 系数值。对多块实验区域的SVM病害提取结果见表4。
表4 不同样本基于SVM分类方法的病害分类精度表
Tab.4 Classification accuracy of disease based on different experimental areas
实验中发现:因为不同地物有相似光谱信息,导致仅利用单一的光谱信息不能很好地分类,SVM分类更好地结合空间特征和光谱特征,明显提高了分类精度。可见,更多空间特征融入对光谱特征有很好的约束,为下一步的壁画颜料层脱落指数的分析提供定量化数据,使高光谱图像的病害识别从定性识别逐渐向定量化发展。
4.2 脱落病害评价指标
最关键的是构建多元回归模型,R中常用lm ()函数回归分析对模型参数估计,利用summary ()显示模型回归结果,并对模型与参数进行显著性检验,以F检验下的p值和Adjusted R-squared来判断。回归结果显示Adjusted=0.8833,p值显示常数项和DRI是显著的,变量DI,BDI和FI对应的p值>0.05,说明变量DI,BDI 和FI 不显著。存在不显著情况说明指标间存在多重相关,倘若直接剔除不显著自变量,回归模型显著性通过的同时也造成了信息的损失。
以选取的DI ,BDI 和FI变量作为指标要素,采用逐步回归法(Step Regression,SR)来消除各个指标要素之间的多重共线性来选取最优回归方程,利用R语言中的step()逐步回归分析direction用来确定逐步搜索的方向,利用both“一切子集回归法”来进行逐步,并以AIC 准则作为决定变量存在与否的准则,见表5,AIC值越小的模型,拟合精度越高。
实验发现,当AIC 值为42.42,不管其他变量增加或者减少,AIC值都在增大,所以更新公式得到LS-SR-AIC最优模型,即y关于DRI和DI的线性回归模型,此时模型F检验下的p值<0.05,通过显著性检验。
表5 不同自变量所建回归方程的 AIC 值
Tab.5 AIC values of regression equations constructed by different independent variables
分别对比模型优化前后的Adjusted R -squared 和P值,表6为经过逐步回归之后的回归模型评价指标:调整后的和标准误差SE分别为0.9314和0.0526。
表6 改进前后回归方程的调整后和p 值
Tab.6 Adjustedand p values of regression equations before and after improvement
实验结果表明,y 值与DRI 和DI 的变化存在相关关系,壁画病害的破损率指数和病害密度指数可以作为衡量壁画严重程度的关键指标要素,由此得到了评价壁画颜料层脱落病害程度的最优模型。
利用上面调整后得到的回归方程对实验区的损坏严重程度进行评估,如图7所示,a图为原图,b图中黄色为病害。通过矢量化后的数据计算得到DRI 与DI值,分别代入评估模型sqrt (y )=9.459-11.747×DRI -368.703×DI,得到y值为61.15。根据本文对壁画严重程度的等级划分,可以划分为状态2(60~69),也就是说该研究区域损坏的严重程度等级为轻微严重,该量化评估结果与专家评价结果相比较,有较高的吻合度,验证了LS-SR-AIC方法定量评估壁画颜料层脱落程度的可行性。
图7 实验原图(a)与叠加病害后的图(b)
Fig.7 Experimental original image (a) and disease overlay origni al image (b)
5 结束语
针对壁画的颜料层脱落病害发生的频率大、修复难等问题,本文研究了颜料层脱落病害的相关问题,为了在病害识别学习和病害程度评定模型复杂性之间寻求最佳,提高评价结果的可靠性,文中针对传统人工勾绘、透明格网法、AutoCAD、GIS法等识别病害方法在时间和效率上的不足,尝试采用了SVM法明显改善了壁画颜料层脱落病害的提取精度,使总体精度更好,Kappa系数更高。同时本文针对壁画的病害的面积、数量、边界长度等因素建立了影响壁画的相关指标要素(DRI 、DI、BDI和FI ),提出了LS-SR-AIC模型作为评价壁画颜料层脱落病害的最优模型,很好地实现了病害从定性化研究向定量化研究的过渡。
只是针对颜料层脱落这一种病害对壁画严重程度评价方面的指标建设的初探,为壁画病害程度的鉴定提供了新思路。但针对壁画的多种病害,回归模型的适用性及如何优化,还值得继续研究。
文章转载自微信公众号地理信息世界GeomaticsWorld,版权归原作者及刊载媒体所有。
(点击图片即可查看详细信息)
内容转载、商务活动、投稿等合作请联系
微信号:huitiandi321
邮箱:geomaticshtd@163.com
欢迎关注慧天地同名新浪微博:
ID:慧天地_geomaticser
行业大咖齐聚青岛 欧比特杯高光谱遥感影像智能处理行业应用大赛奖项花落谁家?
高端论坛|北京理工大学李伟教授:基于深度卷积神经网络的高光谱图像分类
《慧天地》敬告
《慧天地》公众号聚焦国内外时空信息科技前沿、行业发展动态、跨界融合趋势,探索企业核心竞争力,传播测绘地理信息文化,为测绘、地信、遥感等相关专业的同学提供日常学习、考研就业一站式服务,旨在打造政产学研用精准对接的平台。
《慧天地》高度重视版权,对于原创、委托发布的稿件,会烦请作者、委托方亲自审核通过后オ正式推发;对于来自网站、期刊、书籍、微博、微信公众号等媒介的稿件,会在作者栏或者文章开头显著标明出处,以表达对作者和推文引用平台版权的充分尊重和感谢;对于来源于网络作者不明的优质作品,转载时如出现侵权,请后台留言,我们会及时删除。感谢大家一直以来对《慧天地》的关注和支持!
——《慧天地》运营团队
指导:万剑华教授