“鹿晗关晓彤”的热点你还能蹭多久?这就告诉你答案

科技工作者之家 2017-10-13

10月8日,在小长假的最后一天, 新浪微博突然崩溃了,原因后来大家都知道,因为鹿晗突然在新浪微博公布恋爱了,随即引发了网友“爆炸式”的转发讨论。

20171013173605_579782.jpg20171013173605_57f437.jpg

图片来源于@小浪 (新浪微博副总裁董文俊)

这个事也引起了科学家的注意,中国科学院行为科学重点实验室朱廷劭研究组就运用微博舆情预测模型,来分析了此次舆情事件的发展态势和预测情况。

鹿晗是在10月8日中午12点发布的恋爱微博,根据对微博数据的分析,不到一个小时,该话题的网民讨论就到达了最高点。

网民在微博中讨论的主要热点关键词除了鹿晗和关晓彤外,还包括:恋情、公开、女朋友、咔咔、迪丽热巴、甜蜜暴击等。而通过对讨论该话题的微博进行情绪分析,科研人员发现积极情绪占据主导位置,比如高兴、祝贺等。下图是参与该话题讨论中转发量较大的几条微博,可见网民情绪还是相当乐观的。但也有很多网友对此事件持消极态度,10月8日、9日网民的消极情绪主要为难过、怀疑和忧郁;10月10日、11日网民的消极情绪主要为憎恶、忧郁和难过。

20171013173617_1aa126.jpg

鹿晗公布恋情事件相关微博

科研人员对该事件截止到10月11日的相关微博数据进行下载并分析,提取微博舆情预测模型所需特征做了热度预测。预测结果表明,该事件不会继续扩大,但已有热度会依然持续,不会马上消退。

说了这么多,我们来认识一下科研人员用来分析热度趋势的舆情预测模型是怎么回事。我们知道,微博由于其庞大的用户量和即时的传播速度,已经使其成为舆情事件酝酿、产生和传播的重要场所,微博中的热门话题可以在短时间内大范围扩散,甚至可能形成重大的舆情事件,需要政府部门或相关责任人及时应对解决。

但是,微博内容的无结构性、动态性和短文本的特点,给舆情事件的趋势预测带来了一定的技术困难。目前关于微博领域的研究大多侧重于心理学、传播学相关的理论研究,或仅是个案分析。而基于微博数据的预测没有充分利用现有心理学及传播学上关于舆情事件的研究成果,考虑的特征较为单一,且实验验证的数据量较小。

针对这一问题,中国科学院行为科学重点实验室朱廷劭研究组基于社会心理学、传播学理论基础,以及已有研究的部分结果,尽可能的完善微博舆情趋势的影响因素,并从实际的舆情事件中提取情绪值、意见领袖、社会态度等特征,通过比较多种经典回归方法,建立了基于大量舆情事件的网络数据训练模型。模型的准确率可达0.78,召回率达0.88。下表为模型最优特征集的准确率、召回率和F值。

20171013173629_d740dc.png

此前,科研人员就曾对2016年福建漳州PX爆燃事件进行次日微博量的预测。根据该话题的真实微博讨论量,以及利用模型预测的微博量,科研人员描绘出该事件的真实发展趋势和预测发展趋势图。由下图可看出,预测值与真实值虽然存在一些偏差,但二者的整体发展趋势较为接近。而且,PX事件在4月8日有明显的下降趋势,预测模型也正确地预测到了这一下降趋势。因此,这个舆情预测模型不仅有理论基础,也展现出了其实际应用价值,对微博舆情是否会发展成为重大舆情事件提供了预警。

20171013173640_83a6c4.png

PX事件发展趋势

该研究是中国科学院行为科学重点实验室朱廷劭研究组在“计算网络心理学”研究领域的系列成果之一。此项研究得到湖北省自然科学基金、中国科学院战略性先导科技专项等课题资助。该研究成果已被国际期刊Cyberpsychology录用并在线发表:ZhouYang, Zhang Lei, Liu Xiaoqian, Zhang Zhen, Bai Shuotian, and Zhu Tingshao. Cyberpsychology,Behavior, and Social Networking. September 2017, 20(9): 533-539. https://doi.org/10.1089/cyber.2017.0142

(来源:中国科学院心理研究所)