谷歌回应Gemini AI模型演示视频争议：承认视频使用静态图像帧，但坚持文本提示是真实的

Google Gemini AI模型演示视频引争议：视频为演示目的使用静态图像帧，引发对真实性能的质疑

Google 最近公布了其强大的 AI 模型套件 Gemini，然而该公司在宣传视频中对其性能的表述引发了争议。据报道，Google 在宣传视频中使用了静态图像帧来展示 Gemini 的能力，而非实时演示。

在一段名为「what the quack」的视频中，Gemini 展示了对图像和语音提示的快速响应，甚至能够追踪杯子和纸球游戏中的纸团。然而，据彭博社专栏作家帕尔米·奥尔森（Parmy Olson）在文章中的指出，Google 在这段视频的描述中声明：「出于本演示的目的，延迟已减少，并且为了简洁起见，Gemini 输出也已缩短。」

奥尔森对这一声明表示不满，并认为 Google 在视频中的演示有误导公众的可能。她指出，视频中的文本提示是真实的，但图像是静态的，并非实时反应。这与 Google 试图传达的内容大相径庭，即一个人可以与 Gemini 进行顺畅的语音对话，同时 Gemini 能够实时观察并回应周围的世界。

Google 对此回应表示，视频中的所有用户提示和输出都是真实的，只是为了简洁而缩短了输出。他们解释称，团队向 Gemini 提供图像和文本，并要求它通过预测接下来会发生什么来作出回应。他们还指出，该视频旨在激发开发者的灵感，而非误导公众。

尽管 Google 试图澄清这一争议，但人们对 AI 模型的演示仍然存在疑虑。近年来，一些公司曾因在演示视频中夸大其词而受到质疑。人们曾怀疑 Google 的 Duplex 演示是否真实，因为视频中明显缺乏环境噪音和过于乐于助人的员工。对 AI 模型的预录制视频也使人们更加怀疑其真实性。

在这种情况下，一些人士认为 Google 在「炫耀」，以转移人们对 Gemini 落后于竞争对手 OpenAI 的 GPT 的事实的注意力。尽管 Google 对此予以否认，但一些人认为他们在公众面前显得措手不及。如果他们想激发开发者的灵感，不是通过精心编辑的炫目短片来误导 AI 的能力，而是应该通过让记者和开发者真正体验产品来展示其真实实力。