• 基于聚类和查询行为的检索结果排序方法

    • 摘要:

      本发明涉及一种基于聚类和查询行为的检索结果排序方法,包括如下步骤:计算文档与查询的相关度,选取候选文档集合;对候选文档集合进行聚类分析,计算每个聚类与查询的相关度;根据文档的相关度和文档所在聚类的相关度,计算文档的排序Rank(di);根据用户点击文档的反馈信息更新文档的相关度和聚类的相关度;更新文档的排序Rank(di).本发明能够根据用户的点击行为,挖掘用户查询所蕴含的各种潜在意图,可以动态的调整文档的排列顺序,从而更好地满足了用户的多样化需求.

    • 专利类型:

      发明专利

    • 申请/专利号:

      CN201410122930.4

    • 申请日期:

      2014.03.28

    • 公开/公告号:

      CN103902694A

    • 公开/公告日:

      2014-07-02

    • 发明人:

      杨静 刘宁 张健沛

    • 申请人:

      哈尔滨工程大学

    • 主分类号:

      G06F17/30(2006.01)I,G,G06,G06F,G06F17

    • 分类号:

      G06F17/30(2006.01)I,G,G06,G06F,G06F17,G06F17/30

    • 主权项:

      一种基于聚类和查询行为的检索结果排序方法,其特征在于:步骤1:计算文档与查询的相关度Sim(q,di),并根据相关度选取候选文档集合;步骤2:对候选文档集合进行聚类分析,计算每个聚类与查询的相关度Sim(q,Clui);步骤3:根据步骤1中获得的文档的相关度Sim(q,di)和步骤2中获得的文档所在聚类的相关度Sim(q,Clui),计算文档的排序Rank(di);步骤4:根据用户点击文档的反馈信息更新文档的相关度Sim(q,di)和聚类的相关度Sim(q,Clui):步骤5:根据步骤4中更新的文档的相关度Sim(q,di)和文档所在聚类的相关度Sim(q,Clui),更新计算文档的Rank(di).