3月30日,中国计算机学会计算机视觉专委会(CCF-CV)走进高校系列报告会第49期“计算机视觉与深度学习前沿技术及应用”报告会在我校举行。报告会由信息学院电子与通信工程系、计算机系联合承办,会议邀请南京信息工程大学刘青山教授、上海交通大学熊红凯教授、浙江大学李玺教授及浙江大学章国锋教授4位学者作特邀报告。活动由电子与通信工程系朱煜教授及计算机系陈志华教授共同主持,来自华东理工大学、华东师范大学、上海大学、上海理工大学等多所高校的近160名师生及相关企业同行聆听了报告。
报告会上,信息学院副院长王喆首先致辞,对各位专家学者的到来表示热烈欢迎和感谢。他指出,计算机视觉与深度学习理论是人工智能研究的主要方向和基础,具有超高的学术研究价值及应用研究价值。高校作为技术研究的主要基地之一,担负着科技创新与人才培养的历史责任,此次CCF-CV专委会计算机视觉与深度学习专题报告会的举行为华理信息学院的科学研究和学生培养带来了新视角、新启发,由此激发的学术钻研热情与学科融合氛围将推动信息学院后续的技术创新与成果转化。
刘青山教授的报告题目是“视觉特征学习——从稀疏到深度”。全面地介绍了其团队近期在基于稀疏的低维视觉特征表示和基于深度学习的视觉特征学习方面的应用研究工作,包括人脸特征点检测与跟踪、深度学习在遥感图像超分辨率中的应用、大气云图的图像理解等诸多方面。刘教授及其团队的研究工作深入而广泛,多次在国际大赛中获得冠军。针对视觉数据维数越来越高、规模呈爆炸式增长的巨大挑战,刘教授系统地阐述了在视觉计算和理解方面的解决思路并进行了未来展望。
熊红凯教授以“Structured Sparse Representation with Deep Convolution Networks”为题,指出深度卷积网络已经极大地促进了高维信号的稀疏表示,尤其是针对图像与视频序列。但目前深度网络存在缺乏可靠的数理统计基础问题。演讲中,熊教授介绍了团队在将深卷积网络和结构化稀疏性用于可伸缩的高维信号的非平稳统计的紧凑表示的最新工作进展,提出了方向多分辨卷积网络RDnet,通过级联方向滤波器组提升高维信号的多尺度逼近。
李玺教授的报告题目为“基于几何自适应深度示例变换网络的鲁棒场景文本检测”。 场景文本检测的难点主要在于目标的方向、形状、尺度变化显著,且自然场景背景复杂。李教授提出了一种符合文本特性的具有几何感知能力的特征表达和一个简洁的端到端的多任务学习模型,即示例变换网络(ITN)。这一模块在结构上非常简洁并且可以和普通卷积层一样非常灵活地嵌入网络结构中。总的来说,示例变换网络框架在简化了网络结构的同时提取到更为可靠的深度特征,从而高效地检测出场景图片中的多方向文本目标。同时,李玺教授还介绍了团队在其他视觉应用领域的卓越工作。
章国锋教授以“视觉SLAM技术及其应用”为题,系统地介绍了基于视觉的同时定位与地图构建(VisualSLAM)在过去十多年里取得的进展,并且对满足实际应用需求的SLAM系统仍需要解决一些关键性难题进行了分析阐述。他介绍了高效地获得尽可能长而且准确的特征轨迹的思路,并提出将多视频序列之间的复杂回路有效闭合起来的改进方案,并提出如何对海量图像/视频数据在有限的内存下进行全局优化的方案,以及有效措施解决在动态环境下进行鲁棒的同时定位与地图构建及处理相机快速运动和强旋转的方案。
4位教授详实地介绍了他们及其团队在计算机视觉与深度学习领域的研究成果及心得,展示的研究成果激发了与会人员的学习热情,报告会现场,学生、企业嘉宾非常珍惜此次学习的机会,纷纷与4位教授交流互动。在近四个小时的报告会中,现场始终洋溢着浓浓的学习气氛。