本发明属于话题溯源范畴语义社会网络中的数据挖掘领域,具体涉及一种基于话题影响力的微博话题溯源方法.本发明包括:根据信息检索领域的隐形语义查询扩展方法,对输入的话题词组tp进行语义扩展,得到与给定话题相关的前k个话题;确定微博网络中的用户关系及信息传播规律,确定话题影响力TIN;根据影响力计算公式,以1h为一个时间步计算话题的影响力,得到话题在传播过程中随着时间变化的影响力趋势,其影响力强度从话题初期的缓慢增长到急剧上升最后达到平稳状态,即话题成长为热点;推导话题溯源递推公式,并确定其溯源递推终止条件,输出引发话题的源头.本发明使话题溯源递推的终止条件更加准确,溯源更加准确有效.
发明专利
CN201410374437.1
2014.08.01
CN104133897A
2014-11-05
杨静 董圆 张健沛 王勇 初妍 张乐君 杨悦 张泽宝 国林
哈尔滨工程大学
G06F17/30(2006.01)I,G,G06,G06F,G06F17
G06F17/30(2006.01)I,G,G06,G06F,G06F17,G06F17/30