轻松识别Midjourney等AI生成图片,开源GenImage

AI生成图片技术已进入高速发展期,每个人都能通过MidjourneyStable DiffusionAI产品生成高质量图片。这些图片逼真度极高,肉眼难以分辨真假。然而,虚假图片可能带来诸多不良影响,例如散播谣言、金融欺诈等。轻松识别Midjourney等AI生成图片,开源GenImage

华为诺亚方舟实验室为解决这一问题,开源了百万量级的GenImage数据集。该数据集为企业和开发者提供了构建AI生成图像与真实图像检测器和评估工具的基础,旨在构建AIGC时代的ImageNet。数据集包含超过一百万对AI生成的假图像和真实图像,内容丰富,涵盖1000类。此外,数据集还利用了最先进的生成器,如Midjourney、Stable Diffusion等。轻松识别Midjourney等AI生成图片,开源GenImage

华为团队对数据集进行了全面分析,提出了两个任务来评估真实场景下的检测方法:

交叉生成器:检测器在一种生成器生成的数据上训练,在其他生成器生成的数据上验证。此任务旨在考察检测器在不同生成器上的泛化能力。
退化图像识别:检测器需识别低分辨率、模糊和压缩图像。此任务主要考察检测器在真实条件中面对低质量图像时的泛化问题。

与以往数据集相比,GenImage不仅规模大,还涵盖各类通用图像,弥补了GAN和Diffusion时代数据集的空白。此外,团队还使用八个先进生成器生成了与真实图片数量相当的虚假图片,确保了数据均衡性。

实验结果显示,在某个生成器上训练的ResNet-50模型在其他生成器上的测试准确率明显降低,突显了检测器对不同生成器生成图片的泛化能力的重要性。华为团队还发现,GenImage数据集对人脸和艺术类图片也具有很好的泛化效果。

随着AI生成图片技术的不断发展,对于AI生成图片的有效检测需求将更加迫切。GenImage数据集为真实环境下的生成图片检测提供了有效训练数据。华为团队使用ResNet-50在GenImage数据集中训练,并在真实推文中进行检测。结果显示,ResNet-50能够有效识别真实图片与虚假图片。这一结果证明了GenImage可以用于训练模型以判别真实世界的虚假信息。

版权声明:AI导航网 发表于 2024-01-16 11:48:17。
转载请注明:轻松识别Midjourney等AI生成图片,开源GenImage | AI导航网

暂无评论

暂无评论...