• 互联网不良信息检测方法以及系统

    • 摘要:

      本发明提供一种互联网不良信息检测方法以及系统.该方法包括:从预检测的网络信息中提取多模态特征,得到与所述多模态特征相对应的各模态特征子向量,包括:从预检测的网络信息中提取内容统计特征、文本相关特征和链接相关特征中的至少两项;对提取到的各模态特征子向量进行特征融合处理,得到多模态联合特征向量;根据多模态联合特征向量,采用机器学习算法进行不良信息检测,得到检测结果.本发明还提供了对应的系统.本发明提供的互联网不良信息检测方法以及系统,能够提高对互联网不良信息的检测性能,而且大大提高了检测系统的鲁棒性.

    • 专利类型:

      发明专利

    • 申请/专利号:

      CN201010536381.7

    • 申请日期:

      2010.11.04

    • 公开/公告号:

      CN102004764A

    • 公开/公告日:

      2011-04-06

    • 发明人:

      毛伟 李晓东 杨卫平 李洪涛 耿光刚 齐超 张桓铭 王国栋 卢文哲

    • 申请人:

      中国科学院计算机网络信息中心%北龙中网(北京)科技有限责任公司

    • 主分类号:

      G06F17/30(2006.01)I,G,G06,G06F,G06F17

    • 分类号:

      G06F17/30(2006.01)I,G,G06,G06F,G06F17,G06F17/30

    • 主权项:

      一种互联网不良信息检测方法,其特征在于,包括:从预检测的网络信息中提取多模态特征,得到与所述多模态特征相对应的各模态特征子向量,提取的多模态特征包括内容统计特征、文本相关特征和链接相关特征中的至少两项;对提取到的各模态特征子向量进行特征融合处理,得到多模态联合特征向量;根据所述多模态联合特征向量,采用机器学习算法进行不良信息检测,得到检测结果.