DeblurGAN: Blind Motion Deblurring Using Conditional Adversarial Networks

/ by GuoWY / 论文来源: https://arxiv.org/pdf/1711.07064.pdf

总 结

  • 这篇paper采用了一个比传统GANs提升很多的新型GANs模型

      这篇文章采用的模型不过是一种改进的GANs网络,但效果比原有GANs提升太多,后文有具体的测试结果。先来说文章的模型吧,其实挺容易理解的,相比较于传统GANs,生成器的改进主要在于增加了九层ResBlock,可以说网络深度是大大加深了,不过大量使用残差网络并附有一个全局连接ResOut,可以解决梯度消失的问题,并尽可能保存有原始图像的完整信息。我觉得真正带来质的飞跃的还是在于判别器,采用的是WGAN-GP,不同于传统判别器本质上是个分类网络,WGAN的输出是一个Wasserstein距离,用Wasserstein距离代替JS散度,能同时完成稳定训练和进程指标的问题,关于这个详细的解释推荐下面这篇解读 【好文推荐】令人拍案叫绝的Wasserstein GAN ,可以说它把WGans的来龙去脉和原理说得非常清楚了。

      下面我们通过测试结果来感受一下WGans相对于传统Gans的进步吧。首先下面几张图是用传统Gans做的人脸模糊还原的测试效果[原图-输入-输出]:

      传统GANs的指标上,PSNR值只能提升零点几,其他指标也比较一般。我们再来看看DeblurGan的测试结果:

      DeblurGan的指标提升上,PSNR值平均能提升2到3个点,SSIM也能提升0.02。(论文中更高一点)

      这样的效果其实已经算不错了,原论文也说了在模糊还原领域提升效果是当时的state-of-art。但是,经过实际测试,发现这个模型的泛化能力不强,就是当输入的模糊图像不满足训练数据的分布时,模型的还原结果是糟糕的。这意味着,除非训练数据集能够涵盖大多数的模糊类型,才能对于任意输入的模糊图片,有较高还原成功概率。不过这基本上是很难做到的事情,因为模糊的本质取决于模糊核和噪音,而模糊核的参数可以是任意的,很难去制作一个涵盖日常生活中全部场景的模糊图片数据集。因此目前还并没有找到一个针对模糊还原的完美的解决方案,主要的瓶颈还是在于,又希望模型的还原质量高,又希望模型的适用度广,这二者是不能兼得的,不过未来随着人们对图像的更深入了解应该会有一些更好的解决方案出现。

      

评 论