Google Gemini AI模型演示视频引争议:视频为演示目的使用静态图像帧,引发对真实性能的质疑
Google 最近公布了其强大的 AI 模型套件 Gemini,然而该公司在宣传视频中对其性能的表述引发了争议。据报道,Google 在宣传视频中使用了静态图像帧来展示 Gemini 的能力,而非实时演示。
在一段名为「what the quack」的视频中,Gemini 展示了对图像和语音提示的快速响应,甚至能够追踪杯子和纸球游戏中的纸团。然而,据彭博社专栏作家帕尔米·奥尔森(Parmy Olson)在文章中的指出,Google 在这段视频的描述中声明:「出于本演示的目的,延迟已减少,并且为了简洁起见,Gemini 输出也已缩短。」
奥尔森对这一声明表示不满,并认为 Google 在视频中的演示有误导公众的可能。她指出,视频中的文本提示是真实的,但图像是静态的,并非实时反应。这与 Google 试图传达的内容大相径庭,即一个人可以与 Gemini 进行顺畅的语音对话,同时 Gemini 能够实时观察并回应周围的世界。
Google 对此回应表示,视频中的所有用户提示和输出都是真实的,只是为了简洁而缩短了输出。他们解释称,团队向 Gemini 提供图像和文本,并要求它通过预测接下来会发生什么来作出回应。他们还指出,该视频旨在激发开发者的灵感,而非误导公众。
尽管 Google 试图澄清这一争议,但人们对 AI 模型的演示仍然存在疑虑。近年来,一些公司曾因在演示视频中夸大其词而受到质疑。人们曾怀疑 Google 的 Duplex 演示是否真实,因为视频中明显缺乏环境噪音和过于乐于助人的员工。对 AI 模型的预录制视频也使人们更加怀疑其真实性。
在这种情况下,一些人士认为 Google 在「炫耀」,以转移人们对 Gemini 落后于竞争对手 OpenAI 的 GPT 的事实的注意力。尽管 Google 对此予以否认,但一些人认为他们在公众面前显得措手不及。如果他们想激发开发者的灵感,不是通过精心编辑的炫目短片来误导 AI 的能力,而是应该通过让记者和开发者真正体验产品来展示其真实实力。