拉斯维加斯手机娱乐网站 (CSIG)
CSIG视频图像与安全专委会
时间:2025年9月20日-21日
地点:中国科学院自动化研究所智能化大厦三层学术报告厅(中关村东路95号)
黄凯奇
黄凯奇,中国科学院自动化研究所研究员、博士生导师,所党委委员、学术委员会委员,智能系统与工程研究中心主任,中国科学院大学特聘教授。国际模式识别学会会士(IAPR Fellow)、拉斯维加斯手机娱乐网站 视频图像与安全专委会主任、中国人工智能学会智能决策专委会副主任、中国指控学会常务理事。面向国际前沿和国家需求,围绕人工智能开展图像理解、认知决策等理论方法、关键技术研究,在国际权威期刊和重要会议发表论文200余篇,多次获得国际/国家学术会议最佳论文,带领团队研发的视频跟踪评测平台(http://got-10k.aitestunion.com)和人机对抗平台(http://turingai.ia.ac.cn)得到学界和业界的广泛关注。授权国家发明专利百余项并用于国家重要部门,知识产权转化千万以上,获得包括国家科技进步二等奖、军队科技进步一等奖、中国指挥与控制学会科技进步奖一等奖在内的多个奖项,担任包括IEEE汇刊等多个国际期刊的副主编和重要国际会议主席。获得国家级领军人才、科技部中青年科技创新领军人才、CCF-IEEE CS青年科学家、国家自然科学优秀青年基金和中国科学院第十二届杰出青年等荣誉。
赫然
报告人简介: 赫然,中科院自动化所多模态人工智能系统全国重点实验室研究员,IAPR/IEEE Fellow,IEEE TIFS副主编。从事人工智能、模式识别和计算机视觉研究。承担国家青年科学基金ABC类以及北京杰出青年科学基金等项目。在本领域国际主流期刊TPAMI和IJCV上发表论文23篇,第一作者11篇论文引用过百;研究工作获CAAI技术发明一等奖、CSIG自然科学一等奖、北京市科技进步二等奖等。指导学生获得IEEE SPS最佳青年论文奖、ICPR最佳科学论文奖、北京市优秀博士论文、中科院优秀博士论文、IEEE生物特征理事会优秀博士论文。曾/现任TIP资深编委、TPAMI\TCSVT\TBIOM\IJCV\PR\TMLR和自动化学报等国内外期刊编委,四次获最佳编委奖,以及NIPS\ICML\ICCV\CVPR\ECCV\ICLR\AAAI\IJCAI等会议领域主席。2019年受邀参加庆祝中华人民共和国成立70周年大会天安门广场观礼。
报告题目:安全可信的生成式人工智能
报告简介:生成式人工智能通过对海量文本、图像、音频等数据的深度学习与模式挖掘自主生成符合人类认知逻辑的内容。基于大语言模型和多模态大语言模型的生成式人工智能技术正以迅猛之势重塑人工智能领域的发展格局。以GPT、DeepSeek为代表的生成模型凭借卓越的生成能力实现了重大技术突破,在创意创作、逻辑推理、自动决策等垂直领域的深度应用中展现出巨大潜力。本报告将介绍生成式人工智能的技术演进脉络,分析其发展过程中引发的安全风险与挑战,并介绍团队在基础模型优化、推理能力提升、高效图像生成等方向的工作。
张华
报告人简介: 张华,中国科学院信息工程研究所,研究员,博士生导师,2015年于天津大学获得计算机应用技术博士学位。围绕视觉内容特征感知及特定目标检测识别展开研究,部分成果已应用于国家安全相关部门的特定内容判别及目标发现以及认知内容自动生成等。近期发表中国计算机学会CCF推荐的A类国际期刊/国际会议论文30篇(TPAMI、IJCV、TIFS、TIT、TIP、CVPR、NeurIPS、ICCV、AAAI、MM)。获A类国际会议CVPR 2020举办的国际竞赛UG2+ Sea Life Detection in the Underwater Condition冠军、(Semi-) Supervised Object Detection in Haze Conditions亚军。主持国家自然科学基金面上项目和青年项目、科技委领域基金项目、人工智能学会华为Mind-Spore学术奖励基金项目 (结题优秀)、启元实验室青年论坛科学白洞 (揭榜大模型可解释性问题) 项目,参与国家自然科学基金联合重点项目、国家科技部重点研发计划课题、科技创新2030新一代人工智能重大项目。主持研制认知引导数据生成、特定内容识别、智能安全评估等系统平台。
报告题目:以视觉为中心的多模态基础模型可信构建与安全应用
报告摘要:人工智能基础模型作为新兴的人工智能技术范式,是迈向通用人工智能技术的关键组成部分之一。随着人工智能基础模型相关技术的广泛应用,带来国家安全、社会伦理、网络空间安全和数据隐私保护等多个层面的风险与挑战,构建可信人工智能基础模型是大规模落地应用的关键环节。本报告聚焦于构建
可信多模态基础大模型,从数据、模型设计、决策响应等维度进行大模型构建的探索工作。主要介绍:1)多模态基础模型的架构设计:如何设计可高效特征提取的基础模型架构;2)多模态基础模型的任务适配:如何应用多模态基础模型提升下游任务的精度;3)多模态基础模型的决策可解释性:如何发现模型决策与输入之间的因果关系。
周琳娜
报告人简介:周琳娜,湖南衡阳人,北京邮电大学网络空间安全学院二级教授,北京邮电大学博士研究生毕业,清华大学博士后。国家百千万人才,国家重点领域创新团队负责人,国务院政府津贴获得者。拉斯维加斯手机娱乐网站 理事,中国防伪行业协会理事、全国金融标准化技术委员会委员、全国专业标准化防伪技术委员会委员。
主要研究领域为多媒体内容取证、人工智能安全、金融安全与监管、信息隐藏、网络行为安全、区块链应用。在相关领域发表学术论文50余篇,编辑出版专著4部。主持完成3项国家自然科学基金重点和面上项目、主持完成3项国家重点科研专项和30余项部级重大科研项目,34次获部级科技进步奖,2006年获国家技术发明二等奖,2009年获国家科技进步二等奖,2016年获国家科技进步二等奖,2019年获国家科技进步二等奖,2011年获国家科技进步一等奖。
报告题目:大模型评测及在垂域的应用
报告摘要:随着大模型的迅猛兴起,如何安全地监管和应用大模型是世界各国面临的难点问题。该报告针对我国现有的大模型安全监管相关政策和标准进行了解读,对大模型的安全评估和性能评测进行了研究,并对垂直领域大模型在深度伪造合成和金融AI投研监管方面的应用进行了研究和探讨。
报告人简介:杜彦辉,中国人民公安大学信息网络安全学院专任教师,教授,博士生导师,网络空间安全执法技术二级学科带头人。研究领域为网络安全、人工智能安全、网络空间安全治理。近5年主持完成“互联网***关键技术与应用”获公安部科学技术二等奖。承担重点研发计划“网络空间安全”课题1项、“**技术及装备”子课题2项、“社区风险监测与防范关键技术研究”子课题1项,参与网信办“网络空间国际治理研究基地”支撑项目3项,主持公安部应用创新计划项目多项。
报告题目:大语言模型安全思考与实践
报告摘要:主要包括三部分,大模型技术发展现状、大模型面临的安全风险分类以及具体的安全防护技术方案。技术发展部分重点分析了2021年进入通用人工智能时代后的突破。技术特点主要围绕多任务处理、涌现能力和认知决策三大特征展开。将大模型安全风险划分为安全性、保障性、隐私性三个维度,并详细分析了每类风险的具体表现(越狱、对齐、伦理、幻觉、对抗样本、后门等)及其危害。针对上述核心挑战(尤其是越狱攻击、生成内容检测、对抗样本、多模态AIGC安全)提出的多项创新性防护、评估与检测技术,展示了在提升大模型安全性、保障性和应对新型威胁方面的研究进展。
王生进
报告人简介:王生进,清华大学长聘教授。清华大学电子系智能计算与自主系统研究中心主任。团队隶属于北京信息科学技术国家研究中心具身智能创新群体。主要研究领域包括计算机视觉、机器学习、智能视频分析与语义描述、行人再识别和人像态势计算、具身智能与多模态协作机器人。研究论文谷歌单篇引用逾5000次。作为起草人之一,制定包括中华人民共和国公共安全行业标准和国家标准在内的10项行业和国家标准。兼任拉斯维加斯手机娱乐网站 视频监控与安全专委会副主任、全国安防标委会人体生物特征识别应用分技术委员会委员、自动化学会国防大数据分会副主任委员,危爆物品探测技术国家工程研究中心副主任、联参指挥保障大队国防科技专家组成员、IEEERegion10北京分会学术活动委员会主席。获得了包括973、863、国家自然科学基金、教育部博士点基金、国家科技支撑计划、国家重点研发计划项目课题等多个国家纵向项目支持,并取得出色成果。实验室在国际重要期刊IEEE和学术会议发表论文逾150篇,其中包括Nautre子刊、IEEETrans等顶级期刊,CVPR/ICCV/ECCV三大顶会,及其他顶会如ICCV2023、AAAI2018的 Oral等。2023年3月实验室协作机器人团队获2023年度Intel室内机器人学习全球挑战赛决赛识别赛道一等奖。申请发明专利15项。获2008年国家科技进步二等奖1项、获2006北京市科学技术一等奖1项,获2019年吴文俊人工智能科学技术自然科学奖,2019年公安部科学技术奖,2021年北京市科学技术奖技术发明一等奖,2023年天津市科学技术进步一等奖。
报告题目:多模态大模型与视频图像语义描述框架
报告摘要:多模态大模型是当前人工智能技术发展的热点之一。多模态大模型通过融合语言、文本、图像、视频、音频等多类媒体数据,实现联合训练获得深度神经网络模型。多模态大模型的核心包括各个模态的编码器、语义对齐网络、特征融合网络等。传统语言模型如RNN,LSTM,针对特定任务、需要大量高质量标注、泛化性较弱。大语言模型使用同一组参数的模型处理不同任务,zero-shot扩展到新任务,在通用/复杂任务上性能显著提高。单模态LLM无法直接应用于视觉任务(感知/认知/推理),实际应用中需要处理图像、文本、视频、音频、3D点云和分子结构等多种模态。本报告重点介绍大模型发展现状、多模态对齐数据联合训练CLIP模型、LLaVA模型多模态大模型。
视频与图像语义描述(Video semantic caption)是计算机通过对视频和图像的理解生成一段文字描述,在自动驾驶,机器人视觉等领域的应用中有着很重要的地位。近年来,随着深度学习技术在计算机视觉领域与自然语言处理领域的突破性进展,图像描述和视频描述的跨模态研究不断涌现。同时,由于视频的时序特征以及视频内容的多样性与复杂性,视频描述相对于图像描述来说具有更大的挑战。作为多模态大模型的一个典型应用方向,视频与图像多模态语义描述具有十分重要的,涉及语音ASR、图生文、视频生文以及大语言模型生成描述文本等技术。本报告同时重点讲解报告人承担的十四五国家重点研发计划项目“视频描述与多模态语义获取”课题中视频图像语义描述框架设计和具体实现方法。
胡晰远
报告人简介:胡晰远,北京工业大学计算机学院教授,博士生导师。在人工智能与计算机视觉、公安视频侦查和影像物证检验鉴定等领域开展研究工作,出版专著两部(科学出版社,清华大学出版社),在Nature Communications, IJCV,IEEE T-SP,Signal Processing,CVPR,ACM MM,ICASSP等信号和图像处理主流期刊和会议中发表论文100余篇,主持3项国家自然科学基金项目和2项国家重点研发计划课题,牵头制订国家和公安行业标准各1项,参与制订国家/公安行业标准10余项,担任中国感光学会理事。曾获公安部科技进步一等奖(2020),中国发明协会创新成果奖二等奖(2025),中国计算机学会(CCF)科技进步优秀奖(2019)和中国感光学会青年科技奖(2019)。
报告题目:面向生成伪造人像的多特征融合可解释性检验技术
报告摘要:随着生成模型和深度伪造模型的迅速发展,人像伪造门槛骤降,伪造质量愈发逼真。但使用完全端到端的深度检测模型具有黑盒特性,可解释性差、可理解度低,可信程度难以评估,难以满足法庭科学对影像物证检验鉴定的要求。提出了从物理、生理和数字特征三个维度出发,挖掘和提炼人像视频图像中难以被人像伪造模型模拟和改变的本质特征,并建立多种具有物理生理意义的可解释性人像鉴伪特征集;并从多种可解释性伪造人像证伪检验特征出发,设计多源先验融合、图空间高阶相关性、跨模态信息交互等前沿思路,提出多种多特征融合的可解释性伪造人像视频检验模型和方法,构建深伪视频人像多特征可信融合量化检验体系,以提高量化检测模型的稳健性和准确率。最后对伪造人像图像/视频检测的未来发展趋势进行展望。
谢剑斌
报告人简介:谢剑斌教授,国防科技大学博士,湖南大学博士生导师。新加坡国立大学访问学者,国际IEEE会员,计算机学会会员,拉斯维加斯手机娱乐网站 会员,电光与控制编委会委员,全国安防科技委委员,中国生物特征识别国家标准组专家,拉斯维加斯手机娱乐网站 视频图像与安全专委会副主任,公安部TC100专家,湖南省安全生产与应急分会副会长,长沙市企事业科协联合会副会长。37年来一直从事视觉计算理论和技术研究,针对军队、武警、公安部、应急管理部和工信部的重大需求,紧紧围绕边境防控、反恐预警、反谍保密、公共安全、应急管理和智能制造,面向视觉大数据、机器视觉和视觉物联网,研究海量视频分析、生物特征识别和视觉机器学习的难题,为军事重地、政府机关、金融场所、生产车间等高等级安全领域提供特别可靠的身份识别和安全预警方法。包括:静脉特征识别、监控人脸识别、异常行为识别、视觉大数据搜索、自主高清摄像、要地无人看守、特种视频显控、特定物体识别等。主持和参与反恐、反谍、反台独、载人航天、数字电视、新型战斗机、平安城市、天网工程、智慧城市、无人系统、智能制造等国家重大课题,其中国家级项目29项、部委级项目21项、军民融合项目48项,注重实战,积极实践军民融合。发表学术论文120多篇,顶级期刊论文6篇;出版学术专著11部,申报国家专利100多项,授权发明专利56项、实用新型37项。荣获国际发明展金奖3项、全国发明展金奖4项、军队科技进步一等奖1项、湖南省科技进步二等奖1项、公安部技术革新特别项目奖2项。2015年荣获湖南省十大优秀专利发明人奖;2016年荣获中国发明创业奖·人物奖;2022年“面向安全生产的超高清视频预警平台”入选国家超高清视频典型应用案例;2023年担任拉斯维加斯手机娱乐网站 长沙服务站站长;2024年荣获军队科技进步一等奖1项,培养学生论文入选湖南省优秀学位论文1篇;2025年“智能视频目标检测与识别技术”入选国家重点图书出版规划项目并于清华大学出版社发行。
报告题目:大模型内容安全治理框架、关键技术与标准化
报告摘要:本讲座聚焦于大模型内容安全的核心挑战与系统性治理路径,探讨治理框架的学术构建与关键技术的科研突破。随着生成式AI的普及,其引发的虚假信息、伦理失范、隐私侵害及系统安全风险亟待结构化治理。
本讲座将基于跨学科视角(计算机科学、法学、伦理学),提出多层级动态治理框架,在政策法规层,解析全球监管动态(如欧盟《AI法案》、中国《生成式AI服务管理暂行办法》)及其对技术合规性的约束;在组织治理层,研究企业内生治理模型,涵盖伦理审查机制、全生命周期责任链设计及用户反馈闭环系统;在技术实施层,深入剖析关键安全技术,包括对抗性文本检测(基于Transformer鲁棒性优化)、深度伪造多媒体内容溯源(数字水印与GAN指纹识别)、价值观对齐算法(RLHF的强化安全微调)及隐私保护推理(联邦学习与差分隐私)。
标准化作为治理落地的核心枢纽,本讲座将分析国际标准组织(ISO/IEEE)与中国信标委在评估基准(如偏见量化指标、安全红队测试规程)、跨平台协同治理接口等方面的前沿进展,并探讨治理框架与AI可解释性(XAI)的交叉研究如何提升透明度与问责效能。
通过对治理范式与技术路线的融合分析,本讲座旨在为学术研究与产业实践提供理论指引,推动构建安全可控、可信可靠的大模型生态系统。
张卫明
报告人简介:张卫明,中国科学技术大学教授、网络空间安全学院副院长,拉斯维加斯手机娱乐网站 数字媒体取证与安全专委会副主任。主要研究兴趣包括信息隐藏和人工智能安全。已在IEEE TIT、TPAMI、CCS、USENIX Security、S&P、NDSS、CVPR、ICCV等期刊、会议发表论文300多篇,谷歌学术引用18000多次,入选爱斯维尔高被引学者和斯坦福全球前2%顶尖科学家,担任IEEE TDSC的Associate Editor。任国家基础加强计划重点项目“首席科学家”,主持国家自然科学基金重点、国家重点研发课题、国家863等项目30余项。获得军队科技进步奖一等奖、安徽省自然科学奖一等奖、河南省自然科学奖一等奖、安徽省教学成果特等奖,并获得ACM SIGSOFT杰出论文奖、CCS’24杰出成果奖等国际会议论文奖6项。
报告题目:从跨媒介水印到大模型水印
报告摘要:数字水印技术可以用于版权保护、内容溯源、完整性认证等场景。人工智能背景下水印技术发生了三方面变化。1)深度学习的发展形成了全新的水印框架,提升了打印-拍照、屏幕-拍照等跨媒介水印的鲁棒性。2)大模型训练成本巨大,因此需要作为重要资产被保护。但是,大模型被套壳、数据集被违规用于训练的案例屡屡发生。如何保护大模型本身及其训练集的知识产权成为亟待解决的问题。3)生成式人工智能的兴起导致虚假信息泛滥、人类信息生态被重塑,对大模型生成内容进行鉴别与溯源成为迫切需求。水印作为解决上述问题的主要技术,成为了大模型安全的热点研究方向。此报告将介绍人工智能背景下水印技术的思想演进、关键技术和发展趋势。
1. 本期讲习班限报120人,根据缴费先后顺序录取,报满为止。
2. 2025年9月18日(含)前注册并缴费:CSIG会员2000元/人,非会员2500元/人(赠送1年CSIG会员);现场缴费:会员、非会员均为3000元/人;CSIG团体会员参加,按CSIG会员标准缴费;同一单位组团(5人及以上)报名,均按CSIG会员标准缴费。
3. 注册费包括讲课资料和2天会议期间午餐,其它食宿、交通自理。
4. 即日起至2025年9月18日,请登录会议注册网站注册。
5. 会议注册网址:由办公室补充
联系方式
联 系 人:黄老师
联系电话:010-82544754
邮 箱:igal@csig.org.cn
Copyright © 2025 拉斯维加斯手机娱乐网站 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190