• 社交网络突发事件的层次分析方法

    • 摘要:

      本发明提供一种社交网络突发事件的层次分析方法,包括:获取突发热词共现图;确定与突发热词共现图对应的二分图,对二分图进行k派系过滤处理,得到各个k派系社团以及每个k派系社团对应的各最大派系;按预设度量指标,分别对每个k派系社团对应的每个最大派系中包含的突发热词节点进行降序排列;根据经过降序排列处理的各最大派系中突发热词节点的排列顺序,构建突发事件特征树;对突发事件特征树进行树深度为k的广度优先遍历,确定k深度分支以及每个k深度分支对应的子分支;确定每个分支即每个k深度分支及其对应的子分支对应的最大派系中所包含的突发热词节点构成突发事件的一个子事件,从而实现精细粒度的突发事件和子事件检测.

    • 专利类型:

      发明专利

    • 申请/专利号:

      CN201510061738.3

    • 申请日期:

      2015.02.05

    • 公开/公告号:

      CN104615718A

    • 公开/公告日:

      2015-05-13

    • 发明人:

      怀进鹏 于伟仁 李建欣 卢忠宇 张日崇

    • 申请人:

      北京航空航天大学

    • 主分类号:

      G06F17/30(2006.01)I,G,G06,G06F,G06F17

    • 分类号:

      G06F17/30(2006.01)I,G06Q50/00(2012.01)I,G,G06,G06F,G06Q,G06F17,G06Q50,G06F17/30,G06Q50/00

    • 主权项:

      一种社交网络突发事件的层次分析方法,其特征在于,包括:获取突发热词共现图;其中,所述突发热词共现图的节点集包括各突发热词节点以及分别与每个突发热词节点存在共现关系的各共现词节点,所述突发热词共现图的边集包括所述各突发热词节点与所述各突发热词节点分别对应的共现词节点间的边;其中,所述突发热词共现图为对关键词共现图进行突发热词检测后得到的,所述关键词共现图根据所述社交网络中的待处理数据文本中包含的共现关键词得到,所述共现关键词是指同时出现在同一个数据文本中的关键词;确定与所述突发热词共现图对应的二分图,所述二分图的节点集合由所述突发热词共现图中的突发热词节点组成,所述二分图的边集合中的边根据所述突发热词共现图中各突发热词节点间的边确定,且所述二分图的边集合中的边为无权边;对所述二分图进行k派系过滤处理,得到各个k派系社团以及每个k派系社团对应的各最大派系,其中,每个k派系社团中包含的突发热词节点构成一个突发事件,每个k派系社团对应的每个最大派系构成突发事件的一个方面,k取大于或等于3的整数;分别以所述各个k派系社团中的每个k派系社团作为待处理k派系社团,根据预设节点重要性度量指标,分别对所述待处理k派系社团对应的每个最大派系中包含的突发热词节点进行降序排列,得到经过所述降序排列处理的各最大派系;根据经过所述降序排列处理的各最大派系中突发热词节点的排列顺序,构建突发事件特征树,其中,所述突发事件特征树中节点间的父子关系是根据所述各最大派系中突发热词节点的排列顺序确定的;对所述突发事件特征树进行树深度为k的广度优先遍历,确定所述突发事件特征树中树深度不超过所述k时对应的各k深度分支;确定每个k深度分支对应的子分支,其中,每个k深度分支对应的子分支包括承接在所述k深度分支的叶子节点下的各子分支;确定与每个k深度分支以及所述每个k深度分支对应的子分支对应的最大派系中所包含的突发热词节点构成所述待处理k派系社团对应的突发事件的一个子事件.