本发明提供一种基于语义扩展的微博突发事件检测方法及装置,本发明提供的基于语义扩展的微博突发事件检测方法包括:获取与待检测的微博突发事件对应的第一关键词;根据第一关键词和第一关键词关联的词向量文件,得到微博突发事件;其中,第一关键词关联的词向量文件是采用word2vec方法对训练集中的训练词语进行训练得到的,词向量文件包括第一关键词与其它训练词语之间的语义相似度.本发明的基于语义扩展的微博突发事件检测方法及装置,通过考虑文本的语义信息来扩展事件的关键词,并通过扩展后的关键词进行微博突发事件的检测,可以准确的检测微博突发事件,避免了将同一事件分成两个微博事件,并可以进行在线检测.
发明专利
CN201710022500.9
2017.01.12
CN106886567A
2017-06-23
胡春明 吴博 彭浩 张日崇 李建欣
北京航空航天大学
G06F17/30(2006.01)I,G,G06,G06F,G06F17
G06F17/30(2006.01)I,G,G06,G06F,G06F17,G06F17/30
一种基于语义扩展的微博突发事件检测方法,其特征在于,包括:获取与待检测的微博突发事件对应的第一关键词;根据所述第一关键词和所述第一关键词关联的词向量文件,得到微博突发事件;其中,所述第一关键词关联的词向量文件是采用word2vec方法对训练集中的训练词语进行训练得到的,所述词向量文件包括所述第一关键词与其它训练词语之间的语义相似度.