37000cm威尼斯
学术动态
当前位置: 首页 科学研究 学术动态 正文
物信讲坛第一百九十二讲“资源感知图像去模糊:朝向快速、节能和有效的生成式图像去模糊和再模糊化模型”
发表日期:2024-01-17 阅读:

主讲人:林嘉文

开始时间:1月18日 14:00

地点:思源厅

报告人简介:

林嘉文,台湾清华大学电气工程系教授,人工智能研究中心副主任,电子工程与计算机科学学院多媒体技术研究中心主任,IEEE Fellow,担任IEEE电路与系统学会Fellow评审委员、IEEE电路与系统学会理事。林嘉文教授长期从事包括图像、视频处理和视频网络等方面的研究,在国内外权威杂志和知名的国际会议上发表了论文100多篇,其中第一作者的论文有20多篇,获得了13项美国专利。

报告内容简介:

在动态场景中采集的图像可能包含由相机抖动或物体运动引起的运动模糊,这会明显降低图像的视觉质量,从而影响下游视觉应用。这种模糊会导致短程和长程区域特定的平滑伪影,这些伪影通常是方向性的和不均匀的,因此难以去除。受启发于当前生成图像模型在计算机视觉和图像处理任务中取得的成功,本次演讲将介绍我们近期在图像去模糊模型方面的工作:旨在减少计算、内存和训练数据等资源的消耗,同时仍能达到SOTA性能。我们首先介绍一种基于模糊感知strip-wise注意力的非循环去模糊模型,然后将其扩展到一种新的strip transformer (Stripformer)以实现快速去模糊。接下来,我们展示如何进一步扩展Stripformer以实现多功能视频复原。最后,我们提出一种基于扩散的参数化再模糊模型,以增强包含各种真实运动模糊的训练图像对。