CSIG自然科学奖授予在我国图像图形领域基础研究和应用基础研究中阐明自然现象、特征和规律,做出重大科学发现的个人和团队。
为宣传科技工作者积极进取的工作精神,聚焦获奖团队背后的故事,学会近日对荣获2024年度CSIG自然科学奖一等奖“连续时空模式感知与理解”的项目团队进行了专访,以对话的形式,为读者们提供一次了解他们的机会。
下面就跟着我们的脚步,走近今天的受访团队吧。
问题一:首先非常感谢各位老师接受我们的采访,请先介绍一下团队成员:
本项目主要完成人均来自中国科学院计算技术研究所视觉信息处理与学习(VIPL)研究组,第一完成人为陈熙霖研究员,其他完成人包括山世光研究员、韩琥研究员、王瑞平研究员和张杰副研究员。本项目团队在过去十多年中长期合作,围绕连续时空视觉模式感知与理解开展了系统深入的研究。
问题二:了解完了团队内的各位老师,请为大家简单的介绍一下项目的情况:
视觉是动态环境中感知与交互的重要支撑,动态是视觉的天然属性,其根本挑战在于应对连续时空视觉模式因多维度表观变化及不完整语义带来的不确定性。因此,形成类人的时空多尺度表示以及多语义协同理解,是动态视觉的关键科学问题。项目围绕这一关键科学问题开展研究,受人类视觉在多层次感知、高阶认知因子,以及神经元同步的机理启发,取得了如下主要发现:
(1)提出了空域局部视觉模式的多尺度精细感知模型,建立了由粗到精的层级渐进表示框架,实现了层级学习难度控制,增强了任务觉知的多尺度视觉感知能力。
(2)提出了基于流形的高阶时空关联建模方法,实现了对视频短时平稳性、片段特异性和长时周期性的自适应建模,增强了时域动态视觉模式表示的稳定性。
(3)提出了多任务协同感知与表示学习方法,建立了认知偏差和特征异质条件下的鲁棒特征-语义映射模型,提升了多义性视觉模式感知的鲁棒性。
上述工作在连续时空视觉模式感知与理解中实现了关键位置找得准、运动模式判得清、行为语义辩得明,推动了视觉模式感知与理解的进步。截至2024年11月,8篇代表性论文GS引用3000次,单篇最高706次,单个GitHub开源算法获4600多个star。获国际会议IEEE FG2019最佳海报论文奖1项,国际学术竞赛冠/亚军3项。通过与华为、平安等大型企业合作,研究成果成功应用于智能手机、智慧园区等。
问题三:请问各位老师在科研过程中,有没有什么好的方法可以推荐给大家?
基础研究选题中坚持问题驱动,明确科学价值或应用价值,既要来立足现实中的重要需求,又要瞄准尚未解决的关键科学问题。既要有一定挑战性和创新点,又要在合理的时间框架内可完成(“跳一跳够得着”)。科研过程中深挖问题,关注细节,接受失败,持续优化。
问题四:在项目的研究过程中有遇到什么困难吗?大家是如何解决的?
连续时空视觉模式的感知与理解是计算机视觉领域的一个重要前沿问题,研究初期我们主要面临两个方面的困难:
一是学术任务的定义较为复杂,需要在理论上对动态视觉的本质特性进行深入探索;
二是视频数据资源的规模较小,对研究的支撑有限。面对这些挑战,我们聚焦于“动态性是视觉的核心属性”这一关键科学问题,借鉴人类视觉感知的机理,从空间多层级、时间多尺度、任务多样性等角度重新定义了学术任务框架,为研究奠定了坚实的理论基础。
同时,我们投入了大量精力进行高质量数据资源的建设。例如,我们自主构建了多个数据集,包括视频人脸识别数据集和视频人脸心率估计数据集等,并将这些数据资源向学术界公开,以便推动后续研究的深入开展。
问题五:最后,大家有什么获奖感言想说呢?
首先,非常感谢拉斯维加斯手机娱乐网站 授予我们自然科学奖一等奖,这是对我们团队多年来科研工作的高度认可和鼓励。感谢奖励评审委员会的信任,感谢学会为广大科研工作者搭建了一个交流与展示的平台,也感谢各位专家和同行对我们的支持与指导。
其次,特别感谢研究团队的每一位成员,正是大家的努力、坚持和默契合作,才促成了这一成果的取得。在科研道路上,我们经历了许多挑战与困难,但也正是这些历练让我们更加坚定追求学术卓越的初心。
未来,我们将以此为新的起点,持续在图像图形学领域深耕,探索更多科学前沿问题,为推动学科发展和国家科技进步贡献我们的力量!
Copyright © 2025 拉斯维加斯手机娱乐网站 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190