轻松识别Midjourney等AI生成图片，开源GenImage

AI 生成图片技术已进入高速发展期，每个人都能通过Midjourney、Stable Diffusion等AI产品生成高质量图片。这些图片逼真度极高，肉眼难以分辨真假。然而，虚假图片可能带来诸多不良影响，例如散播谣言、金融欺诈等。

华为诺亚方舟实验室为解决这一问题，开源了百万量级的GenImage数据集。该数据集为企业和开发者提供了构建AI生成图像与真实图像检测器和评估工具的基础，旨在构建AIGC时代的ImageNet。数据集包含超过一百万对AI生成的假图像和真实图像，内容丰富，涵盖1000类。此外，数据集还利用了最先进的生成器，如Midjourney、Stable Diffusion等。

华为团队对数据集进行了全面分析，提出了两个任务来评估真实场景下的检测方法：

交叉生成器：检测器在一种生成器生成的数据上训练，在其他生成器生成的数据上验证。此任务旨在考察检测器在不同生成器上的泛化能力。
退化图像识别：检测器需识别低分辨率、模糊和压缩图像。此任务主要考察检测器在真实条件中面对低质量图像时的泛化问题。

与以往数据集相比，GenImage不仅规模大，还涵盖各类通用图像，弥补了GAN和Diffusion时代数据集的空白。此外，团队还使用八个先进生成器生成了与真实图片数量相当的虚假图片，确保了数据均衡性。

实验结果显示，在某个生成器上训练的ResNet-50模型在其他生成器上的测试准确率明显降低，突显了检测器对不同生成器生成图片的泛化能力的重要性。华为团队还发现，GenImage数据集对人脸和艺术类图片也具有很好的泛化效果。

随着AI生成图片技术的不断发展，对于AI生成图片的有效检测需求将更加迫切。GenImage数据集为真实环境下的生成图片检测提供了有效训练数据。华为团队使用ResNet-50在GenImage数据集中训练，并在真实推文中进行检测。结果显示，ResNet-50能够有效识别真实图片与虚假图片。这一结果证明了GenImage可以用于训练模型以判别真实世界的虚假信息。