• 多源社交数据融合的多角度旅游信息感知与智能推荐方法

    • 摘要:

      本发明公开了一种多源社交数据融合的多角度旅游信息感知与智能推荐方法,用于解决现有旅游信息推荐方法实用性差的技术问题.技术方案是首先为每个景区建立单独的字典;再从所有评论文本中挑选至少包含一个景观词且具有高信息熵的评论句子,利用得到的评论文本数据,结合景观词集合,挖掘每个景观相对应的特征,利用序列模式挖掘方法从每篇游记中提取一条旅游路线,最后利用投票的方法将热度最高的路线作为推荐信息;通过比较图像上下文和评论文本之间的文本相似性,投票选择与景观对应的有代表性的图像.由于采用了序列模式挖掘算法对博客游记的文本部分进行处理,最终得到了最受游客欢迎的旅游路线,为游客提供了更全面的辅助信息,实用性好.

    • 专利类型:

      发明专利

    • 申请/专利号:

      CN201611251837.9

    • 申请日期:

      2016.12.30

    • 公开/公告号:

      CN106600482A

    • 公开/公告日:

      2017-04-26

    • 发明人:

      郭斌 郭彤 於志文 王柱 周兴社

    • 申请人:

      西北工业大学

    • 主分类号:

      G06Q50/14(2012.01)I,G,G06,G06Q,G06Q50

    • 分类号:

      G06Q50/14(2012.01)I,G06F17/30(2006.01)I,G,G06,G06Q,G06F,G06Q50,G06F17,G06Q50/14,G06F17/30

    • 主权项:

      一种多源社交数据融合的多角度旅游信息感知与智能推荐方法,其特征在于包括以下步骤:步骤一、对于目标景区,根据景区名称利用网络爬虫获得旅游社交系统中与所述景区相关的所有评论和游记数据,提取评论中的文本数据、游记中的文本图像数据以及上下文信息,并对文本进行分词预处理,过滤无用的中文停止词,为每个景区建立单独的字典;步骤二、从所有评论文本中挑选至少包含一个景观词且具有高信息熵的评论句子,其中句子的信息熵等于句中每个单词信息熵的总和;步骤三、利用步骤二得到的评论文本数据,结合景观词集合,挖掘每个景观相对应的特征,其中特征包括名词和形容词;步骤四、利用序列模式挖掘方法从每篇游记中提取一条旅游路线,最后利用投票方法将热度最高的路线作为推荐信息;步骤五、通过比较图像上下文和评论文本之间的文本相似性,投票选择与景观对应的有代表性的图像.