• 基于栈式稀疏自编码的人脸图像性别识别系统

    • 摘要:

      本发明涉及一种基于栈式稀疏自编码的人脸图像性别识别方法,属于图像识别、机器学习、计算机视觉领域.其中训练过程包括对人脸标准库FERET和CAS-PEAL-R1中的图像灰度化、直方图均衡化、几何校正、图像归一化、训练稀疏自编码模型、逻辑回归分类器训练、微调模型、模型融合,预测过程包括摄像头捕获自然场景图像、图像灰度化、直方图均衡化、人脸检测、几何矫正、图像归一化、利用栈式稀疏自编码模型预测、结果标注.本发明采用栈式稀疏自编码模型来处理人脸性别识别问题,可以逐层地学习到图像的组合特征,对原始信号有更好抽象表示,发明同时利用微调对隐藏单元所提取的特征做进一步调整,获得更高的识别准确率.

    • 专利类型:

      发明专利

    • 申请/专利号:

      CN201510420256.2

    • 申请日期:

      2015.07.16

    • 公开/公告号:

      CN105069400A

    • 公开/公告日:

      2015-11-18

    • 发明人:

      朱青 张浩 贾晓琪

    • 申请人:

      北京工业大学

    • 主分类号:

      G06K9/00(2006.01)I,G,G06,G06K,G06K9

    • 分类号:

      G06K9/00(2006.01)I,G06N3/08(2006.01)I,G,G06,G06K,G06N,G06K9,G06N3,G06K9/00,G06N3/08

    • 主权项:

      基于栈式稀疏自编码的人脸图像性别识别方法,其特征在于,包含以下步骤:首先为训练过程,包括:步骤1,选用人脸标准库FERET和CAS‑PEAL‑R1中的图像作为训练样本数据;步骤2a,用转换公式:Garyi,j=0.299Ri,j+0.587Gi,j+0.114Bi,j对选用的人脸标准库图像进行灰度化,直方图均衡化,然后用类Haar特征与Adaboost算法进行人脸检测,记录检测到的人脸图像区域坐标;步骤2b,利用DAM算法对获得的人脸图像进行定位和几何校正,利用转换公式(xi‑xmin)/(xmax‑xmin)进行图像归一化,将像素取值范围由0‑255归一化至0‑1区间,所述转换公式(xi‑xmin)/(xmax‑xmin)中,x表示图像中所有像素值组成的集合;xi表示图像中位置i的像素值;表示归一化后的位置i的像素值;xmin,xmax分别表示集合i中的最小值和最大值;将图像的像素值中下一行的向量拼接在上一行向量后面,将所述图像的像素值组成的二维向量拉成一维向量;步骤3a,建立栈式稀疏自编码模型,用该模型来学习人脸性别特征,学习得到的特征是m*hl的矩阵,其中,m表示样本数,hl表示最后一层网络中隐层神经元的数量;用L‑BFGS优化算法,对自编码模型的每层依次进行训练你,分别进行400次迭代,训练好隐层神经元个数分别为1000、500、100的三个自编码模型后,去掉它们的输出层,将前一层网络隐层的输出值作为后面一层网络的输入值,组成含有三个隐层(1000‑500‑100)的栈式稀疏自编码模型;步骤3b,将得到的性别特征(m*hl矩阵)作为输入,以Logistic Regression作为性别分类器,用随机梯度下降法(SGD)进行训练;步骤3c,构建一个与该栈式稀疏自编码模型网络结构相同的神经网络模型;步骤4,将步骤3a‑3c中每层网络的输入‑隐层权重矩阵、输入层偏置向 量、学习率、稀疏性参数等保存至二进制文件,将FERER和CAS‑PEAL‑R1两个人脸标准库训练后得到两个模型分别为M1和M2的决策结果进行加权平均;其次为预测过程,包括:步骤1',通过摄像头捕获自然场景图像;步骤2',如所述训练过程步骤2a和步骤2b中,对自然场景图像进行灰度化,直方图均衡化,然后对其进行人脸检测,记录相应区域人脸所在位置坐标,再对检测到的人脸区域进行人脸几何校正、图像归一化预处理,将预处理后的图像,拉伸成一个长向量;步骤3',根据所述训练过程所生成模型M1和M2分别进行预测,将步骤2'得到的长向量作为训练过程得到的模型M1和M2的输入,分别在模型M1和M2中进行一层一层的特征学习,步骤同3a,得到自然场景图像中人脸的性别特征;步骤4',将所述步骤3'中得到的性别特征输入性别分类器Logistic Regression,步骤同3b,根据所述性别分类器的综合决策结果与人脸检测过程中检测到的人脸所在位置坐标,在原图中进行标记.