谷歌重磅发布：超大规模多模态AI模型Gemini，三大版本可选，手机也可直接使用

当地时间12月6日，谷歌CEO桑达尔·皮查伊（Sundar Pichai）在官方博客上宣布，谷歌旗下DeepMind 公司开发的史上最大规模多模态AI 大模型Gemini 1.0正式上线。

在发布博文中，皮查伊表示：“每一次技术变革都是推进科学发现、加速人类进步和改善生活的机会。我相信我们现在所看到的人工智能转变将是我们一生中最深刻的转变，远远大于之前向移动或网络的转变。”

皮查伊透露，目前推出的Gemini 1.0是原生多模态大模型，是谷歌大模型新时代的第一步，它包括三种量级：能力最强的Gemini Ultra，适用于多任务的Gemini Pro以及适用于特定任务和端侧的Gemini Nano。

据悉，目前谷歌的类ChatGPT 应用Bard已经升级到了Gemini Pro版本，实现了更为高级的推理、规划、理解等能力，同时继续保持免费。谷歌预计在明年初将推出“Bard Advanced”，其将使用Gemini Ultra。自ChatGPT发布以来，谷歌的竞品Gemini模型的能力一直备受关注。这款大模型早在今年3月就已传出风声，5月的I/O大会进入“即将推出”的状态。随着知情人士不断透露新信息，有媒体报道称Gemini有万亿参数，训练动用的算力是GPT-4的五倍。但Gemini的正式发布却似乎因为各种原因而屡遭推迟。

今年4月份，谷歌将旗下Google Brain和DeepMind合并为一家新公司Google DeepMind，新公司将聚焦于AI研究。由此，Gemini由新组成的Google DeepMind汇合两个实验室的力量进行攻关。由此可以看出，谷歌在大模型军备竞赛上孤注一掷的心态。

那么，Gemini能否给我们带来惊喜？除了在各种Benchmark上拿到最优成绩，甚至超越人类以外，有趣的是，在新闻发布会上，面对记者有关“Gemini相比以前的大模型有哪些新能力”的提问，Google DeepMind产品副总裁Eli Collins回答说：“我怀疑有”，表示谷歌仍然在努力了解Gemini Ultra的全部能力。

以下为谷歌CEO皮查伊的声明：
每一次技术变革都是推进科学发现、加速人类进步和改善生活的机会。我相信我们现在所看到的人工智能转变将是我们一生中最深刻的转变，远远大于之前向移动或网络的转变。人工智能有潜力为世界各地的人们创造从日常生活到非凡的机会。它将带来新一波的创新和经济进步，并以前所未有的规模推动知识、学习、创造力和生产力。这让我感到兴奋：有机会让人工智能为世界各地的每个人提供帮助。

作为一家人工智能优先的公司，我们已经走过了近八年的历程，进步的步伐只会不断加快：数百万人现在在我们的产品中使用生成式人工智能来完成一年前无法完成的事情，从寻找答案到更复杂的问题使用新工具进行协作和创造的问题。与此同时，开发人员正在使用我们的模型和基础设施来构建新的生成式人工智能应用程序，世界各地的初创公司和企业正在利用我们的人工智能工具不断成长。这是令人难以置信的势头，然而，我们才刚刚开始触及可能性的表面。我们正在大胆而负责任地开展这项工作。这意味着我们的研究要雄心勃勃，追求能够为人类和社会带来巨大利益的能力，同时建立保障措施并与政府和专家合作，应对人工智能变得更加强大的风险。我们将继续投资最好的工具、基础模型和基础设施，并在我们的人工智能原则的指导下将它们引入我们的产品和其他产品中。