谷歌与OpenAI大模型巅峰对决：Gemini与GPT-4激战正酣，数学代码能力却遭碾压

大模型巅峰对决开启！Gemini与GPT-4激战正酣，数学代码能力却遭碾压

【新智元导读】近日，谷歌与OpenAI的大模型巅峰对决正式开启。在这场PK中，被谷歌寄予厚望的复仇杀器Gemini与GPT-4展开激战。虽然Gemini在数学和代码方面的表现惨遭碾压，但在讲笑话和写作方面却意外地出色。

在这次PK中，双方都使出了浑身解数。虽然宣传手段有些夸大其词，但谷歌凭借Gemini在LLM大战中挽回了一些颓势。然而，目前双方都还藏着杀手锏没有放出来。真正的巅峰对决恐怕要等Gemini Ultra或者集成了OpenAI神秘Q*技术的新模型出场后才能揭晓。

在这次PK中，超大杯的选手Gemini Ultra还未出场。这位神秘选手在32个广泛使用的学术基准测试中击败了GPT-4。不过，由于目前只有纯文本提示用上了Gemini Pro，因此Bard暂时还没有得到加持的图像理解能力。

在之前的对决中，GPT-4略胜一筹，但这次对决中，Bard进步巨大。这些测试虽然不够全面，但也提供了一个很好的基准，可以用来判断这些AI聊天助手在普通用户日常任务中的表现。

在编程方面，虽然新版Bard生成的代码没什么大问题，但需要在前面添加一个import string才能运行。好在这个bug很容易解决。然而，不知道是因为好奇网友太多导致负荷超载，还是系统本身就不稳定。针对这道题，Bard在大部分时候都会先“沉默”30秒，然后返回错误提示：“抱歉，出了点岔子，Bard目前还处在试验阶段”。

总的来说，这场大模型巅峰对决非常激烈。虽然Gemini在数学和代码方面表现不佳，但在其他方面却有着不俗的表现。这场对决不仅展示了AI技术的最新成果，也为未来的发展提供了宝贵的经验教训。让我们期待更多精彩的巅峰对决！