大模型巅峰对决开启!Gemini与GPT-4激战正酣,数学代码能力却遭碾压
【新智元导读】近日,谷歌与OpenAI的大模型巅峰对决正式开启。在这场PK中,被谷歌寄予厚望的复仇杀器Gemini与GPT-4展开激战。虽然Gemini在数学和代码方面的表现惨遭碾压,但在讲笑话和写作方面却意外地出色。
在这次PK中,双方都使出了浑身解数。虽然宣传手段有些夸大其词,但谷歌凭借Gemini在LLM大战中挽回了一些颓势。然而,目前双方都还藏着杀手锏没有放出来。真正的巅峰对决恐怕要等Gemini Ultra或者集成了OpenAI神秘Q*技术的新模型出场后才能揭晓。
在这次PK中,超大杯的选手Gemini Ultra还未出场。这位神秘选手在32个广泛使用的学术基准测试中击败了GPT-4。不过,由于目前只有纯文本提示用上了Gemini Pro,因此Bard暂时还没有得到加持的图像理解能力。
在之前的对决中,GPT-4略胜一筹,但这次对决中,Bard进步巨大。这些测试虽然不够全面,但也提供了一个很好的基准,可以用来判断这些AI聊天助手在普通用户日常任务中的表现。
在编程方面,虽然新版Bard生成的代码没什么大问题,但需要在前面添加一个import string才能运行。好在这个bug很容易解决。然而,不知道是因为好奇网友太多导致负荷超载,还是系统本身就不稳定。针对这道题,Bard在大部分时候都会先“沉默”30秒,然后返回错误提示:“抱歉,出了点岔子,Bard目前还处在试验阶段”。
总的来说,这场大模型巅峰对决非常激烈。虽然Gemini在数学和代码方面表现不佳,但在其他方面却有着不俗的表现。这场对决不仅展示了AI技术的最新成果,也为未来的发展提供了宝贵的经验教训。让我们期待更多精彩的巅峰对决!
暂无评论...