• 一种基于Web页面元数据的用户访问行为形式化描述方法

    • 摘要:

      本发明公开了一种基于Web页面元数据的用户访问行为形式化描述方法.本发明首先提出了一种分层次的用户行为框架结构,从"动作一活动一事务"三个层次对用户访问行为及特征进行描述;结合此行为框架,进一步提出基于页面元数据的Web用户行为形式化描述方法,并对其中的页面元数据获取以及动作、行为、事务之间的转化等问题进行了说明.我们提出的基于网页元数据的用户访问行为形式化描述方法,不仅描述了用户访问序列信息,还增加了访问内容的局部主题、关键字等信息.本方法对用户行为的形式化表示有助于加强对用户行为的理解,对个性化网络服务系统的构建提供了更好的支持.

    • 专利类型:

      发明专利

    • 申请/专利号:

      CN200610041621.X

    • 申请日期:

      2006.01.10

    • 公开/公告号:

      CN1804844

    • 公开/公告日:

      2006-07-19

    • 发明人:

      郑庆华 杜瑾 刘均 吴茜媛 丁娇

    • 申请人:

      西安交通大学

    • 主分类号:

      G06F17/30(2006.01)I,G,G06,G06F,G06F17

    • 分类号:

      G06F17/30(2006.01)I,G,G06,G06F,G06F17,G06F17/30

    • 主权项:

      1、基于Web页面元数据的用户行为形式化描述方法,其特征在于:构造一种三层的行为框架,对行为从"动作"、"活动"、"事务"三个层面进行形式化描述,首先从Web日志文件对用户的访问行为进行动作分析,提取能描述用户访问过程的页面集作为用户动作序列;其次,对动作序列进行活动分析,结合所访问页面包含的元数据内容,构造带行为语义信息的访问活动序列;最后对用户访问活动序列进行事务分析,将同一访问过程中的活动子集归为一次访问事务,把全部活动序列依照访问时间先后和时间间隔大小划分为多个访问事务.