GPT-4V在最新基准测试中表现欠佳,对勾股定理的误解导致错误率飙升至90%

近日,马里兰大学发布了一项最新研究,揭示了GPT-4V模型在视觉理解方面的严重问题。该研究针对GPT-4V视觉模型进行了首个专为其设计的基准测试,名为HallusionBench。测试结果显示,GPT-4V在回答视觉问题时的错误率高达90%,甚至包括对基本数学原理的误用和无法识别红绿灯等致命错误。GPT-4V在最新基准测试中表现欠佳,对勾股定理的误解导致错误率飙升至90%

这项测试涵盖了多个领域和多种图片类型,包括数学、文化、体育、地理等领域的原始错觉图片、图表、地图、海报、视频等。然而,GPT-4V在回答这些问题时却表现得相当挣扎。研究人员指出,GPT-4V的错误率之所以如此之高,主要是因为它在处理多个图像之间的时间关系和常识查询方面存在困难。

暂无评论

暂无评论...