阅读 98

Adobe把GAN搞成了缝合怪,凭空P出1024分辨率全身人像| CVPR 2022

 博雯发自凹非寺

  量子位公众号 QbitAI

  换脸见多了,换身材的见过吗?

  给定一张脸,就能自动换一个下半身,服饰、身材、肤色都毫无 PS 痕迹:

  核心技术当然还是我们熟悉的 GAN,但不同的是,现在身体的每个部分都能被 PS 了。

  从脸,肤色、服饰、头发等身体各个部位,甚至到肢体动作,都能被随意设计和组合,最终“缝”成一张1024 × 1024分辨率的全身照片:

  而且这张“缝合怪”还完全没有拼接行为带来的阴影和边界:

  △上方的面部由新方法生成,阴影边界很少

  怎么做到的?把用于生成人体不同部位的 GAN“拼”起来。

  这就是 Adobe 团队最新提出的一种结合多个预训练的 GAN 进行图像生成的新方法,论文目前已被 CVPR 2022 接收:

  接下来就一起来看看他们到底是如何实现的。

  用 PS 的方式 GAN 出个人体

  如我们开头所说,这是一种将多个 GAN 拼接起来使用的方法,研究团队将其称之为InsetGAN

  共分为两类 GAN:

  • 全身 GAN (Full-Body GAN),基于中等质量的数据进行训练并生成一个人体。

  • 部分 GAN,其中包含了多个针对脸部、手、脚等特定部位进行训练的 GAN。

  这两类 GAN 的合作方式类似于 PS:全身 GAN 是一张已经有打底线稿的画布,而部分 GAN 则是一张一张叠在上面的图层。

  但不同边界的“图层”在叠到画布上时,一定会有出现对齐问题。

  比如,将一张脸添加到身体上时,在肤色的一致性、衣服边界和头发披散的自然性上可能出现细节的扭曲和丢失,或出现伪影(Artifacts):

  如何才能更好地协调多个 GAN,让它们产生一致的像素呢?

  研究团队设计了这样一种架构:

  他们首先引入了一个边界框检测器,检测部分 GAN 生成的特定区域在底层画布,也就是全身 GAN 生成的区域中的位置,经过裁剪后再将特定区域嵌入。

  这一过程相当于找到了两个区域之间的一种随机潜码 (latent code),使得所选区域的边界能够和嵌入区域相匹配,以实现无缝合成。

  同时,他们还会对这两个区域进行下采样(Downsample),再次增加图像像素内容的一致性。

  基于这种方法,InsetGAN 可以在训练后生成多张完整人像,同时肤色、头发和相关姿势都能作出相应调整:

  研究团队也与之前的生成全身人像的方法 CoModGAN 做了比较,都是基于左侧的人体进行面部的替换,显然,InsetGAN 生成的面部更加自然:

  △上为 InsetGAN,下为 CoModGAN

  作者介绍

  论文共有 6 位作者,5 位来自 Adobe 研究院,还有 1 位来自阿卜杜拉国王科技大学(KAUST)。

  其中有 Adobe 的首席科学家 Jingwan Lu,是 PS 2020 中智能肖像、皮肤平滑、着色和神经风格化等过滤器的主要算法贡献者,也是 RealBrush 笔刷合成器的开发者。

  她目前领导的团队主要致力于利用大数据和生成性 AI(比如 GAN)来进行视觉内容的创造。

  所以,准备好足不出户换身材了吗?(手动狗头)

  论文地址:

  https://arxiv.org/abs/2203.07293

  参考链接:

  [1]https://www.youtube.com/watch?v=YKFYEt5hvOo

  [2]http://afruehstueck.github.io/insetgan/

来自: 网易科技


文章分类
百科问答
版权声明:本站是系统测试站点,无实际运营。本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 XXXXXXo@163.com 举报,一经查实,本站将立刻删除。
相关推荐