欢迎访问华东交通大学理学院网站!

理学院“格致”学术讲座(第四期)

作者:揭平明  来源:理学院   时间:2020-10-30  点击:

报告题目:细粒度视觉分类与检索

人:彭宇新  教授

报告时间:20201030(周五)上午10:00

报告地点:北区图书馆210报告厅

报告人简介:

        彭宇新,北京大学博雅特聘教授、博士生导师、国家杰出青年科学基金获得者、科技部中青年科技创新领军人才、中国人工智能产业创新联盟专家委员会主任委员、中国工程院人工智能2.0”规划专家委员会专家、中国图象图形学学会理事兼副秘书长。主要研究方向为跨媒体分析与推理、图像视频识别与理解、计算机视觉。2016年获北京市科学技术奖一等奖(第一完成人)。主持了863、国家自然科学基金等20多个项目,发表论文160多篇,包括ACM/IEEE TransCCF A类论文70多篇。多次参加由美国国家标准技术局NIST举办的国际评测TRECVID视频样例搜索比赛,均获第一名。主持研发的跨媒体互联网内容分析与识别系统已经应用于公安部、工信部、国家广播电视总局等单位。担任IEEE TCSVT等期刊编委。

报告摘要:

      与一般的视觉分类不同,细粒度视觉分类旨在对粗粒度的大类(如鸟、车等)进行细粒度的子类划分(如大冠蝇霸鹟、阿卡迪亚霸鹟、蓝鹀等鸟类子类别;奥迪 A6A8等车类子类别),其挑战在于外形、颜色等相似导致的不同类别差异小,姿态、视角等不同导致的相同类别差异大。如何借鉴人脑的认知机理,模拟视觉注意力机制学习多粒度的辨识性特征,突破细粒度视觉分类难题,对于提高计算机的感知和认知能力至关重要。本报告将介绍我们在细粒度视觉分类上的相关研究进展,包括空间拓扑注意力学习、堆叠式深度强化学习、层次化深度增量迁移学习等方法,以及我们在细粒度跨媒体检索上的探索,实现了由图像、视频到跨媒体的扩展,由分类到检索的扩展。



欢迎感兴趣的师生参加!