本发明提供一种互联网不良信息检测方法以及系统.该方法包括:从预检测的网络信息中提取多模态特征,得到与所述多模态特征相对应的各模态特征子向量,包括:从预检测的网络信息中提取内容统计特征、文本相关特征和链接相关特征中的至少两项;对提取到的各模态特征子向量进行特征融合处理,得到多模态联合特征向量;根据多模态联合特征向量,采用机器学习算法进行不良信息检测,得到检测结果.本发明还提供了对应的系统.本发明提供的互联网不良信息检测方法以及系统,能够提高对互联网不良信息的检测性能,而且大大提高了检测系统的鲁棒性.
发明专利
CN201010536381.7
2010.11.04
CN102004764A
2011-04-06
毛伟 李晓东 杨卫平 李洪涛 耿光刚 齐超 张桓铭 王国栋 卢文哲
中国科学院计算机网络信息中心%北龙中网(北京)科技有限责任公司
G06F17/30(2006.01)I,G,G06,G06F,G06F17
G06F17/30(2006.01)I,G,G06,G06F,G06F17,G06F17/30
一种互联网不良信息检测方法,其特征在于,包括:从预检测的网络信息中提取多模态特征,得到与所述多模态特征相对应的各模态特征子向量,提取的多模态特征包括内容统计特征、文本相关特征和链接相关特征中的至少两项;对提取到的各模态特征子向量进行特征融合处理,得到多模态联合特征向量;根据所述多模态联合特征向量,采用机器学习算法进行不良信息检测,得到检测结果.