• 基于时-频域趋势变化的密文语音感知哈希及检索方案

    • 摘要:

      本发明公开了一种基于时-频域趋势变化的密文语音感知哈希及检索方案,将语音分为时域和频域两部分提取感知哈希,采用适应于大规模数据、效率较高的混沌异或加密算法对语音进行加密,再使用数字水印技术将感知哈希序列嵌入密文语音的最低有效位中,生成密文语音库和系统感知哈希表.将密文语音库和感知哈希表上传云端.检索时对用户提供的索引语音提取感知哈希序列,将该摘要序列作为索引提交云服务器,并在云端的系统哈希表中匹配检索,当该感知哈希序列与系统哈希表中感知哈希值匹配成功时,为用户返回哈希表中该哈希摘要对应的密文语音,检索成功.从而实现了对云端加密语音的快速、准确检索.本发明在使用时区分权重、先后匹配,从而在大规模应用时提高了匹配效率.

    • 专利类型:

      发明专利

    • 申请/专利号:

      CN201510240584.4

    • 申请日期:

      2015.05.13

    • 公开/公告号:

      CN104835499A

    • 公开/公告日:

      2015-08-12

    • 发明人:

      王宏霞 郝广洋

    • 申请人:

      西南交通大学

    • 主分类号:

      G10L19/02(2013.01)I,G,G10,G10L,G10L19

    • 分类号:

      G10L19/02(2013.01)I,G06F17/30(2006.01)I,H04L29/06(2006.01)I,G,H,G10,G06,H04,G10L,G06F,H04L,G10L19,G06F17,H04L29,G10L19/02,G06F17/30,H04L29/06

    • 主权项:

      一种基于时‑频域趋势变化的密文语音感知哈希及检索方案,基于感知哈希的密文语音检索方案实现对密文语音在不解密情况下的快速准确检索,包含如下步骤:(1)感知哈希提取:将语音信号分为时域和频域两部分;时域采用不重叠分帧,从第二帧开始,比较每帧与前一帧的短时能量,如果大于前一帧,表示该帧提取的时域感知哈希为1,否则为0;将提取的感知哈希值按分帧顺序排列,形成整段语音的时域感知哈希序列h1;频域分析采用重叠分帧,帧移等于时域分帧的帧长,首先以帧为单位对语音进行傅里叶变换,将语音信号从时域变换到频域,再将频域信号转换到Bark域,计算24个Bark域中12到19共8个Bark域的短时能量值,再对这8个值进行DCT变换,最终用DCT变换后的低频分量来代表该帧的频域能量,从第二帧开始,比较每帧与前一帧的频域能量,若大于,表示该帧提取的频域感知哈希值为1,否则为0;将提取的感知哈希值按分帧顺序排列,形成整段语音的频域感知哈希序列h2;采用交叉结合方法将h1和h2结合起来,形成最终的感知哈希序列h;(2)密文语音库生成:对(1)所获感知哈希序列h使用混沌异或方法对语音加密,最后采用数字水印方法将感知哈希序列嵌入加密后的语音,形成嵌有感知哈希的密文语音;混沌异或加密采用的迭代公式为xn=μxn(1‑xn),其中,μ=3.98,x0为加密算法的密钥,x0∈(0,1);采用该迭代公式生成伪随机序列,再将伪随机序列二值化,与语音数据块的二进制数据按位异或,得到加密后的语音;在密文语音中每10ms选取一个采样点,在该采样点的最低有效位嵌入感知哈希值,生成嵌有感知哈希的密文语音;对语音库中每段语音进行上述操作,并将所有提取的感知哈希序列保存在系统感知哈希表中;最后将得到的嵌有感知哈希的密文语音库和对应的系统感知哈希表上传云端;(3)密文语音检索:由用户提供较短的索引语音片段,并同样采用(1)和(2)的方法生成索引感知哈希摘要;使用与该感知哈希摘要相同长度的滑动窗,在系统哈希表中滑动匹配与该索引感知哈希摘要最为相似的感知哈希序列,当匹配成功时,返回与该感知哈希序列对应的密文语音,即检索成功.