杨静女,1962年生于黑龙江哈尔滨.哈尔滨工程大学计算机科学与技术学院教授、博士生导师.主要研究方向为数据库与知识工程、数据挖掘、隐私保护、软件理论等. E-mail :yangjing@ hrbeu.edu.cn
本发明属于话题溯源范畴语义社会网络中的数据挖掘领域,具体涉及一种基于话题影响力的微博话题溯源方法.本发明包括:根据信息检索领域的隐形语义查询扩展方法,对输入的话题词组tp进行语义扩展,得到与给定话题相关的前k个话题;确定微博网络中的用户关系及信息传播规律,确定话题影响力TIN;根据影响力计算公式,以1h为一个时间步计算话题的影响力,得到话题在传播过程中随着时间变化的影响力趋势,其影响力强度从话题初期的缓慢增长到急剧上升最后达到平稳状态,即话题成长为热点;推导话题溯源递推公式,并确定其溯源递推终止条件,输出引发话题的源头.本发明使话题溯源递推的终止条件更加准确,溯源更加准确有效.
杨静 董圆 张健沛 王勇 初妍 张乐君 杨悦 张泽宝 国林
哈尔滨工程大学
2014-11-05
本发明涉及一种基于聚类和查询行为的检索结果排序方法,包括如下步骤:计算文档与查询的相关度,选取候选文档集合;对候选文档集合进行聚类分析,计算每个聚类与查询的相关度;根据文档的相关度和文档所在聚类的相关度,计算文档的排序Rank(di);根据用户点击文档的反馈信息更新文档的相关度和聚类的相关度;更新文档的排序Rank(di).本发明能够根据用户的点击行为,挖掘用户查询所蕴含的各种潜在意图,可以动态的调整文档的排列顺序,从而更好地满足了用户的多样化需求.
杨静 刘宁 张健沛
2014-07-02
本发明提供了一种基于半监督聚类的查询扩展方法,包括如下步骤:(1)查询似然估计语言模块对用户查询进行初次检索,返回检索结果的前n个文档;(2)对初次检索结果中的前k个文档进行人工标注,分成相关文档集与不相关文档集两类;(3)通过约束和距离融合的半监督聚类算法对前n个文档进行分析,提取与查询相关的文档作为反馈文档;(4)根据反馈文档,用扩展词选取模块选取扩展词,将扩展词和原始查询组成新的查询.本发明通过对少量标注文档与查询相关性的学习,能够较准确的估计出大量未知文档与查询的相关性,提高了反馈文档的质量,从而有效的提高了检索的查全率和查准率.
2013-09-25
人工智能,计算机软件
中国科学院软件研究所
计算机软件,计算机系统结构
国防科学技术大学
计算机软件,光电子学与激光技术,信息处理技术
中国科学院光电技术研究所
计算机软件
安徽工程大学计算机与信息学院计算机科学与工程系
北京大学信息科学技术学院
北京大学信息科学技术学院软件研究所
北京航空航天大学计算机学院计算机应用工程系
东北大学计算机应用技术研究所
东北大学软件学院