本发明涉及一种基于聚类和查询行为的检索结果排序方法,包括如下步骤:计算文档与查询的相关度,选取候选文档集合;对候选文档集合进行聚类分析,计算每个聚类与查询的相关度;根据文档的相关度和文档所在聚类的相关度,计算文档的排序Rank(di);根据用户点击文档的反馈信息更新文档的相关度和聚类的相关度;更新文档的排序Rank(di).本发明能够根据用户的点击行为,挖掘用户查询所蕴含的各种潜在意图,可以动态的调整文档的排列顺序,从而更好地满足了用户的多样化需求.
发明专利
CN201410122930.4
2014.03.28
CN103902694A
2014-07-02
杨静 刘宁 张健沛
哈尔滨工程大学
G06F17/30(2006.01)I,G,G06,G06F,G06F17
G06F17/30(2006.01)I,G,G06,G06F,G06F17,G06F17/30
一种基于聚类和查询行为的检索结果排序方法,其特征在于:步骤1:计算文档与查询的相关度Sim(q,di),并根据相关度选取候选文档集合;步骤2:对候选文档集合进行聚类分析,计算每个聚类与查询的相关度Sim(q,Clui);步骤3:根据步骤1中获得的文档的相关度Sim(q,di)和步骤2中获得的文档所在聚类的相关度Sim(q,Clui),计算文档的排序Rank(di);步骤4:根据用户点击文档的反馈信息更新文档的相关度Sim(q,di)和聚类的相关度Sim(q,Clui):步骤5:根据步骤4中更新的文档的相关度Sim(q,di)和文档所在聚类的相关度Sim(q,Clui),更新计算文档的Rank(di).