一、报告题目:构建隐私增强的高效去中心化学习框架
讲者信息:于东晓,国家优秀青年科学基金获得者,山东大学“齐鲁青年学者”,博士生导师,教授。现任山东大学计算机科学与技术学院副院长。2014年毕业于香港大学,获博士学位。目前研究领域主要包括去中心化学习、分布式计算和边缘计算。共发表学术论文100余篇,获得国际会议最佳论文奖4项(IEEE IPCCC 2020、PDCAT 2020、CsoNet 2019、IIKI 2019)、最佳论文提名奖1项(WASA 2019)。作为项目主要负责人主持了国家及省部级项目10余项,并获得微软学者奖,ACM武汉学术新星奖以及山东省自然科学奖二等奖。目前是多个国际顶级会议的委员会委员及重要期刊编辑。
报告摘要:随着近年来欧盟“通用数据保护条例”(General Data Protection Regulation,GDPR)以及我国“网络安全法”的落地实施,重视数据隐私和安全已经成为全球各国的共识。随之而来的是传统的分布式机器学习框架逐渐向去中心化学习的方式演进,通过联合建模代替了以往中心化的资源整合方式,向无损数据隐私迈出了有意义的一步。去中心化学习作为一种新的分布式机器学习框架,旨在以众包的方式,广泛整合用户/机构的算力与通信资源,以去中心化的方式完成联合建模。在这个过程中,如何增强隐私保护机制和如何实现轻量级的、绿色的模型整合是两个亟待解决的关键问题。本报告首先分别对去中心化学习与隐私保护以及绿色通信的问题进行回顾,并分析存在的问题与挑战。最后,报告也将介绍目前最新的研究进展以及本团队的最新相关研究工作。
二、报告题目:和而不同:多聚类挖掘
讲者信息:余国先,山东大学软件学院教授,博(硕)士生导师,主要从事机器学习及其在生物医学数据分析中的应用研究,领衔获重庆市自然科学奖(2019)。2013在华南理工大学获计算机应用技术博士学位,在国内外著名会议和期刊(KDD, IJCAI, AAAI, TKDE, TNNLS, TKDD, Bioinformatics, TCBB, 中国科学-信息科学等)发表论文80余篇。主持(完成)国家自然科学基金3项(面上、应急管理、青年),联合承担国家基金重点项目1项。担任多个SCI期刊编委,KDD, AAAI, IJCAI, ICDM, SDM, ECAI等重要国际学术会议AC/SPC/PC。CCF人工智能与模式识别专委会委员,生物信息学专委会委员;中国人工智能学会机器学习专委会委员,生物信息学与人工生命专委会委员。
报告摘要:聚类是机器学习的主要分支之一,现有聚类技术普遍关注产生一个高质量的聚类结果,但在许多现实应用中,针对同一数据集,却可能存在多个和而不同的聚类结果,每个聚类均较好的质量和意义,这些聚类可更为充分地揭示数据内在的不同结构和规律。本报告将介绍我们团队在多聚类,多视图多聚类及其在生物数据挖掘等领域的研究进展。
三、报告题目:从大规模网络表征学习到时空表征学习
讲者信息:于彦伟,中国海洋大学计算机科学与技术学院副教授,硕士生导师,中国海洋大学“青年英才工程”入选者。2014年毕业于北京科技大学获计算机科学与技术专业博士学位,2012年9月-2013年9月赴美国伍斯特理工学院(WPI)进行为期一年的博士联合培养,2016年11月-2018年9月在美国宾夕法尼亚州立大学(PSU)从事博士后研究。2014年3月-2019年7月在烟台大学工作,2019年8月调入中国海洋大学。主要研究方向为数据挖掘、机器学习、分布式计算以及数据库系统。在ACM TODS、IEEE TBD、KDD、WWW、UbiComp、CIKM、ICDM等国际高水平期刊和会议上发表论文40余篇,包括中国计算机学会A类顶级期刊/会议6篇、B类期刊/会议10篇、C类期刊/会议6篇、A类中文期刊4篇。先后主持国家自然科学基金项目3项,包括青年项目1项、面上项目2项。担任多个CCF A/B类国际会议的程序委员会委员;是山东人工智能学会理事、CAAI智能服务专委会委员、CCF人工智能与模式识别专委会通讯委员。
报告摘要:网络表征学习在最近几年引起了学术界和工业界的极大关注,在数据挖掘领域和机器学习领域都掀起了一波“网络嵌入”研究的热潮。然而针对大规模复杂异质网络的分析和利用均处于非常初级的研究阶段,另一方面,深度表征学习在时空数据挖掘领域应用日益广泛,时空表征学习为复杂时空数据挖掘提供了一种新型思路。本报告首先回顾复杂异质网络表征学习的背景,介绍实现有效且高效的大规模复杂网络表征学习面临的主要问题和挑战;然后,介绍本团队在大规模复杂异质属性网络表征学习方面的最新工作;最后,报告将介绍如何将时空表征学习应用于多个时空挖掘任务的解决方案,以及本团队在复杂时空数据表征学习方面的最新研究工作。
四、报告题目:分布式环境下海量时空数据计算问题研究
讲者信息:于自强,烟台大学计算机学院副教授,学科带头人。CCF数据库专委会委员,山东省人工智能学会理事。2018年至2019年,在加拿大约克大学信息技术学院从事助理研究员,主要研究方向为大规模时空数据计算,相关成果发表在SIGMOD 2020、SIGMOD 2021、TKDE、EDBT、《软件学报》 等数据库和数据挖掘领域的国内外顶级期刊和会议上。主持国家自然科学基金面上项目、青年项目、山东省重点研发计划等多项国家和省部级课题。获得2015年APWeb-WAIM(CCF C类)最佳论文奖,2016年山东大学优秀博士学位论文、2016 ACM济南优博奖(由图灵奖得主John Hopcroft颁奖)、2020 ACM济南学术新星奖。担任TKDE、JCST、EAAI、Information System、《计算机研究与发展》等国内外学术期刊的审稿人以及CIKM等国际会议的程序委员会委员。
报告摘要:随着移动互联网和移动终端的深度普及,现实生活中很多领域面临大规模的亟待处理的时空数据。已有的时空数据集中式计算方式受到计算资源的限制,在计算效率和可扩展性等方面难以满足大规模时空数据计算的需求。为此,本报告主要对分布式环境下海量时空数据的分布式计算问题进行研究,主要包括对移动对象k近邻查询问题、基于动态路网的k条最短路线计算问题以及多数据流的频繁伴随模式挖掘问题。针对已有的移动对象k近邻查询算法迭代次数过多难以实现分布式部署等问题,我们提出一种分布式动态条状索引结构以及基于该索引结构的分布式查询算法,该算法部署到分布式计算集群后,有效降低了移动对象k近邻查询时不同计算节点的数据交互次数,提高了查询效率;针对动态路网的k条最短路线查询问题,我们提出了一种分布式双层路线索引结构,解决了动态路网权重变化对路线索引的影响。基于该索引结构,进一步提出一种分布式k条最短路线查询策略,将复杂的查询问题分解为可以由多个计算节点并行处理的若干子问题,有效提高查询效率。针对多数据流的频繁伴随模式挖掘问题,我们提出了一种前缀压缩树(Sig-Tree)索引结构以及基于该索引结构的多级剪枝策略,实现对频繁伴随模式的实时发现。
五、报告题目:校园数据驱动的学生成绩预测研究
讲者信息:崔超然,博士,山东财经大学计算机科学与技术学院教授,博士生导师。主要研究兴趣为数据挖掘、机器学习、多媒体信息处理。目前,在TMM、TCSVT、TIST、计算机学报、软件学报、SIGIR、MM、IJCAI等国内外重要学术会议及期刊上发表论文50余篇。作为学术带头人,牵头组建山东财经大学机器学习与大数据分析团队,并入选山东省高等学校优势学科人才团队培育计划。主持(完成)国家自然科学基金项目2项、国家重点研发计划子课题1项、山东省自然科学基金项目1项,累计获得科研经费超过800万元。被共青团山东省委授予“山东省青年岗位能手”荣誉称号,获得山东省人工智能优秀青年奖,入选山东财经大学“青年优秀人才支持计划”。目前担任山东省人工智能学会常务理事、中国计算机学会人工智能与模式识别专委会委员、中国计算机学会计算机视觉专委会委员。
报告摘要:学生成绩预测旨在利用学生的相关信息预测其在未来的学业表现,对于学校顺利开展个性化教学、学业预警等工作具有重要的支撑作用。现有研究主要面向慕课等在线教学平台,相关方法难以适用于当前主流的校园教学场景。本报告针对校园教学场景,以课程相关性分析和校园行为感知为切入点,分别介绍我们团队在学生课程成绩预测和学年末综合成绩预测上的初步探索和相关成果。
六、报告题目:跨媒体信息检索技术研究
讲者信息:刘萌,山东建筑大学计算机科学与技术学院,教授,硕士生导师。2019年博士毕业于山东大学计算机科学与技术学院。研究方向为多媒体计算与信息检索。迄今为止发表CCF A 类会议长文、IEEE 汇刊等相关学术论文27篇,在Morgan & Claypool 出版社出版专著1 部,已经获得授权国家发明专利10项。目前主持国家自然科学基金1项,参与国家自然科学基金项目5 项。与此同时,担任国际期刊Research Reports on Computer Science 的编委,CCF C 类期刊Multimedia Systems(MMSJ)特刊的客座编辑;担任多个知名国际期刊和会议的审稿人,包括ACM MM, SIGIR, AAAI, CVPR,ICCV,COLING,IEEE TIP,IEEE TMM,IEEE TKDE、Information Sciences, Journal of Electronic Imaging, Pattern Recognition等;担任山东省人工智能学会理事,中国计算机学会多媒体和人工智能与模式识别专委会委员,中国图象图形学学会多媒体和机器视觉专委会委员。
报告摘要:视频和图像数据呈爆炸式增长,致使人们对跨媒体信息检索的需求与日俱增。例如,如何高效地从监控视频流检索目标视频片段,以辅助维护社会治安;如何实现图像-文本双向检索,提升用户搜索体验等。但是,跨媒体信息检索技术研究并非易事,面临诸多挑战,如跨模态语义鸿沟、多媒体内容分析与理解、高效检索算法设计等。本次报告中,我将分享我们在上述两个具体研究上的初步探索和相关成果。