在人工智能艺术创作工具快速发展的背景下,Nvidia研究人员推出了一种创新的文本到图像个性化方法,名为Perfusion。与其他大型AI图片生成模型不同,Perfusion体积仅为100KB,并且训练时间仅需4分钟。
该技术是由Nvidia与以色列特拉维夫大学合作撰写的研究论文中介绍的。尽管尺寸较小,但在特定版本的效率方面,它能够胜过Stability AI的Stable Diffusion v1.5、新发布的Stable Diffusion XL(SDXL)和MidJourney等领先的AI艺术生成器。
Perfusion采用一种名为“Key-Locking”的全新方法,在图像生成过程中将用户想要添加的新概念与更一般的类别联系起来,以避免过度拟合。这样一来,可以灵活地表达个性化的概念,同时保持其核心特征。与其他AI图像生成器相比,Perfusion具有更高的视觉质量和与文本的对齐性。
暂无评论...