新物网

当前位置:首页 > 互联网

互联网

谷歌推扩散模型变种UFOGen 真正实现一步文生图

时间:2023-11-28 20:58:11 小新
要点:1. 谷歌研究团队提出了一种名为UFOGen的扩散模型变种,只需要一步就能生成高质量的图片。2. UFOGen通过改变生成器的参数化方式和重构损失函数的计

要点:

1. 谷歌研究团队提出了一种名为UFOGen的扩散模型变种,只需要一步就能生成高质量的图片。

2. UFOGen通过改变生成器的参数化方式和重构损失函数的计算方式,理论上可以实现一步生成。

3. UFOGen的生成器和判别器都是由Stable Diffusion模型初始化,这样可以最大限度地利用Stable Diffusion的内部信息。

11月20日 消息:近年来,扩散模型在视觉创作领域的应用不断增加,但是生成速度一直是一个问题。然而,随着技术的进步,UFOGen模型的出现解决了这个问题,它只需要一步就能生成高质量的图片。通过改变生成器的参数化方式和重构损失函数的计算方式,UFOGen实现了一步生成的目标。

论文地址:https://arxiv.org/pdf/2311.09257.pdf

之前对扩散模型生成速度的研究主要集中在两个方向,一方面是利用更少的离散步数求解扩散模型的采样ODE,另一方面是利用知识蒸馏的方法将采样路径压缩到更小的步数。然而,谷歌的研究团队在UFOGen模型中采用了一种全新的思路,通过改变生成器的参数化方式和重构损失函数的计算方式来实现一步生成的目标。

UFOGen模型是在扩散模型和GAN混合模型的基础上发展而来的。扩散模型假设降噪分布是一个简单的高斯分布,但这种假设只在降噪步长趋于0时成立,导致生成速度很慢。而UFOGen模型通过使用带条件的GAN来模拟降噪分布,取较大的降噪步长来减少步数,从而提高了生成速度。