CSIG自然科学奖授予在我国图像图形领域基础研究和应用基础研究中阐明自然现象、特征和规律,做出重大科学发现的个人和团队。
为宣传科技工作者积极进取的工作精神,聚焦获奖团队背后的故事,学会近日对荣获2024年度CSIG自然科学奖二等奖“受限环境下多模态视觉感知理论与方法”的项目团队进行了专访,以对话的形式,为读者们提供一次了解他们的机会。
下面就跟着我们的脚步,走近今天的受访团队吧。
问题一:首先非常感谢各位老师接受我们的采访,请先介绍一下团队成员:
高伟,北京大学深圳研究生院信息工程学院助理教授/研究员、博士生导师,视频与视觉技术国家工程研究中心深圳分中心成员。曾在香港城市大学、美国加州大学洛杉矶分校、新加坡南洋理工大学学习和工作。研究方向为多媒体编码与处理、多模态学习及应用。发表论文150余篇,出版英文专著2部,申请专利100余项。提交标准提案50余项,参与2项团体标准立项。作为负责人承担10余项国家级与省市级重要科研项目。入选广东省青年拔尖人才计划,荣获2023年AVS产业技术创新奖团队奖、2022年中国计算机学会优秀图形开源软件奖项、2021年国际IEEE多媒体学术新星奖项。负责构建OpenPointCloud、OpenAICoding、OpenDatasets等开源项目。担任多个国际SCI期刊编委。担任国际IEEE视觉信号处理和通信技术委员会委员、亚太信号与信息处理协会图像视频与多媒体技术委员会委员。担任多个国际期刊专题的客座编委。在本领域国际旗舰会议上多次组织研讨会和专题会议,多次组织讲习班并担任讲者。
李革,北京大学深圳研究生院信息工程学院教授、博士生导师,视频与视觉技术国家工程研究中心深圳分中心负责人,中国数字音视频编解码技术标准(AVS)点云编码专题组组长。美国奥本大学电子工程博士学位,美国加州大学戴维斯分校电子工程博士后。在国际会议与期刊上发表了论文200余篇,出版英文专著2部。目前主要从事视频处理与分析、视频大数据挖掘等方面的研究。
项目完成依托的科研载体包括北京大学视频与视觉技术国家工程研究中心、广东省超高清沉浸媒体技术重点实验室。
问题二:了解完了团队内的各位老师,请为大家简单的介绍一下项目的情况:
图像、视频、光场、点云、RGB-D、RGB-T等多模态视觉媒体数据具有广泛的应用价值。然而在实际应用场景中,算法常常受到种种限制,造成感知效果显著下降。本项目创新性地构建了受限环境下多模态视觉感知理论与方法框架,重点研究了样本质量、传输带宽、标注质量受限情况下的机器感知新理论与新方法,具有很强的创新性。进而实现鲁棒可靠的视觉感知能力,支持2D和3D分割检测、视频行为异常检测、多模态视觉理解等多种任务。截至2024年9月,8篇代表性论文均发表在IEEE汇刊和国际顶级会议上,Google Scholar引用1300余次,项目成果获得多位国际国内知名同行学的引用和正面评价。项目成果可以支持自动驾驶、虚拟现实、智能机器人等领域应用。
问题三:请问各位老师在科研过程中,有没有什么好的方法可以推荐给大家?
多和科研同行交流:与大同行和小同行的交流沟通,有时会激发我们更加清晰的了解自己的科研问题,或许有新的启发。时刻保持谦虚心态,向有经验的科研前辈们多请教、多学习,时常听听他们的建议,对我们肯定非常地有好处。
问题四:在项目的研究过程中有遇到什么困难吗?大家是如何解决的?
科研过程是一个漫长的探索过程,我们需要花很多时间去思考创新点并且去做大量工程性实验来充分验证所提方案的效果,在此过程中遇到困难在所难免。这些困难可能在研究创新点、工程实现效果等方面,不同的人可能有自己的解决办法,不一定有适合所有人的,需要每个人去感受、去摸索。有些时候不妨听听其他人的一些想法或建议,包括研究同行甚至其他研究领域的人。有些时候也可以去运动、休息或娱乐一下,调整下状态,或许又会豁然开朗。所以大家不妨保持平常心,在这个过程中享受做研究的乐趣。
问题五:最后,大家有什么获奖感言想说呢?
感谢北京大学深圳研究生院信息工程学院和北京大学视频与视觉技术国家工程研究中心的支持,该荣誉的获得离不开团队的集体智慧和贡献。感谢专家评委的认可,感谢学会提供的平台,这次的奖励对于我们来说是一种莫大的鼓励和认可。未来我们将继续努力做好研究,同时与学术同行多多交流和合作。祝愿学会越来越好!
Copyright © 2025 拉斯维加斯手机娱乐网站 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190