当前位置: 网站首页 >> 科学研究 >> 科研进展 >> 正文

实验室师生研究成果在2019ICCV大会发表并获奖

发布者: [发表时间]:2019-11-07 [来源]: [浏览次数]:

IEEE/CVF国际计算机视觉大会(ICCV2019)于2019年10月27日至11月2日在韩国首尔举行。我院共有4篇研究论文在大会主会发表,同时获得一项竞赛亚军,1篇论文获得Workshop最佳Poster奖。

曹治国教授指导的研究生熊海朋、刘承鑫等同学在大会发表了“From Open Set to Closed Set: Counting Objects by Spatial Divide-and-Conquer”论文,该论文的研究工作在国家自然科学基金面上项目的资助下,通过分析现有基于计算机视觉的目标计数方法无法从数量上泛化到现实场景中的问题,发现现有方法都是在有限的训练集(闭集)中学习到有限数量范围内的精确计数,而忽视了现实场景中目标数量可能无上限(开集)的情况,导致现有方法不能很好地泛化到开集中。本研究利用计数值可以空间分解的物理特性,提出利用空间分治,将目标数量转化到可以准确预测的闭集范围内,从而使计数网络可以泛化到现实的开集场景中。该方法直观高效,在三个人群数据库、一个车辆数据库和一个农作物数据库上均大幅领先之前的方法,并达到当前最佳性能。

研究生熊拂、张博深等同学在肖阳副教授、曹治国教授指导下,发表了“A2J: Anchor-to-Joint Regression Network for 3D Articulated Pose Estimation from a Single Depth Image”论文,该论文在国家自然科学基金青年项目资助下,针对目前学术界基于热图的姿态估计方法和3D CNN等姿态估计方法存在的预测时间长、预处理复杂及泛化能力不足等问题,提出了一种基于锚点的姿态估计方法,通过集成多个锚点的预测值来精确回归3D关节点坐标。该方法具有较强的自适应性,针对不同的关节点,锚点在集成投票时可以通过端到端学习的方式挖掘到特定的特征模式。此外,该方法采用2D CNN的方案,且网络结构中不需要上采样操作,大大降低计算量,最终A2J可以在单张GPU上达到105 fps的运行速度。作者进行了5个深度图公开数据库的对比实验,包括3个手势姿态估计数据库以及2个人体姿态估计数据库,测试结果表明A2J已经达到目前业界最佳的效果,并且实测速度相较于之前的方法具有明显的优势。

桑农教授指导的研究生韩楚楚等同学在大会发表了“Re-ID Driven Localization Refinement for Person Search”论文,该论文的研究工作在国家自然科学基金面上项目的资助下,构建了一个端到端的行人搜索框架。当前行人搜索的最佳方法是单独训练检测模型和重识别模型,但问题在于输出的检测框可能并非后续行人重识别任务所需的最优区域。因此本研究提出了一个行人重识别驱动的定位修正框架,通过设计一个可导模块,使检测器可以在重识别损失的监督下进行优化,从而修正检测出的检测框,使其更加有利于重识别任务。实验结果表明,该行人搜索方法在常用数据集CUHK-SYSU上性能大幅超越其它方法,并达到目前最佳性能。

博士研究生邹旭在钟胜教授、颜露新教授和美国西北大学的Ying Wu教授的指导下,在大会发表了“Learning Robust Facial Landmark Detection via Hierarchical Structured Ensemble”论文。该论文的研究工作在国自科青年基金和中国博士后科学基金等项目的资助下,针对传统基于热力图回归的人脸标志点检测方法存在因夸张表情、部分遮挡等特殊情况导致回归处存在多峰、偏移等不准确热力图的难题,提出了一种通过发现人脸图像中稳健的模式而自动构建的分层结构化标志点集成(HSLE)模型,作为人脸标志点间全局和局部的结构化约束并从中学习,使最终回归的人脸标志点热力图更加准确,进而达到提升人脸标志点检测性能的目的。该论文提出的模型可以很容易地集成到现有的基于热力图回归的人脸标志点检测模型中,以进一步提高人脸标志点检测性能。该方法在两个人脸标志点检测数据集上对多个基线方法均有大幅度提升。

大会组织的“The Hands Challenge on 3D Hand Pose Estimation”全球竞赛结果也于10月28日揭晓,我院硕士生熊拂、张博深、于泰东等同学在肖阳副教授、曹治国教授的指导下,参加了“Depth-Based 3D Hand Pose Estimation”和“Depth-Based 3D Hand Pose Estimation while interacting with Object”两个任务的竞赛,均获得第二名,获得了组委会颁发的亚军获奖证书,其学术报告也被评为该专题Workshop的最佳Poster论文。

ICCV每两年举行一次,是计算机视觉领域世界公认的三大顶会之一,论文采取双盲方式评审,录用难度极大。大会反映了该领域的世界最新研究成果,其论文引用与学术影响力在计算机学科名列前茅,每次会议均吸引了计算机视觉与人工智能领域的技术大牛们参加,无论是大会报告,还是分会场报告,均听众踊跃,场场爆满。每篇论文海报前更是云集众多技术精英与作者面对面深入交流,大会堪称为计算机视觉领域的学术盛宴。今年共有4303篇有效投稿论文,最终接受1075篇,而注册参会的人员高达7501名,可见该会议在学界的影响力。