谷歌Gemini新版逆袭，力压o1登顶AI竞技场，能否持续领跑？

发布时间：2024-11-15 13:00 来源：量子位作者：陆辰风

在AI竞技场的风云变幻中，谷歌新模型Gemini（Exp 1114）以黑马姿态震撼登场，一举夺得总榜冠军，引发业界广泛关注。

经过6000余名网友的匿名投票，Gemini不仅在数学领域与学霸级模型o1并驾齐驱，更在其他五个单项上独占鳌头。这一成绩公布后，谷歌CEO皮猜亲自站台祝贺，竞技场官方也第一时间发来贺词，称赞这一非凡成就。

Gemini的崛起，无疑打破了此前关于谷歌AI发展遭遇瓶颈的传言。其强大的实力，甚至让业界猜测，或许只有OpenAI推出满血版o1，方能与之抗衡。目前，新模型已在谷歌AI Studio上线，供用户体验，官方后续还将提供API接口。

从竞技场排名来看，Gemini的分数直线飙升40余分，成功挤下了一直占据榜首的OpenAI模型，包括o1-preview和GPT-4o。在单项比拼中，Gemini同样表现出色，一举夺得复杂提示、数学、创意写作、指令遵循、长查询处理和多轮对话等六个单项第一。

尤为Gemini在数学能力上与o1难分伯仲。据OpenAI官方介绍，o1无需专门训练即可夺得数学奥赛金牌，甚至能在博士级别的科学问答中超越人类专家。然而，Gemini却能在这一领域与之并驾齐驱，展现出其强大的数学处理能力。

尽管在写代码和风格控制方面，Gemini未能挤进前三，但在视觉能力上却夺得第一，超越了GPT-4o。这一成绩，无疑让业界对Gemini的未来充满期待。

然而，Gemini的上线也引发了一些争议。有网友指出，其32k的上下文窗口相比Gemini 1.5的200万上下文窗口有所缩水。对此，谷歌AI Studio负责人表示将尽快进行更新。在用户体验方面，虽然Gemini在某些问题上表现出色，但仍有翻车现象发生，如回答物理问题时出现错误等。

尽管存在争议，但Gemini的崛起无疑为AI竞技场注入了新的活力。其强大的实力和多样的功能，让业界对谷歌AI的未来充满期待。用户可通过谷歌AI Studio体验Gemini，感受其带来的全新AI体验。

更多>同类内容

京东三季度业绩亮眼，政企业务创新服务助力用户降本增效

11-15

努比亚Z70 Ultra全新发布：首创AI声纹识别会议翻译，引领人机交互新潮流

11-15

国家级法律AI基座模型发布，助力司法工作智能化

11-15

雷军广州车展谈小米汽车：工厂睡觉罚款，拍照只为回应提产呼声

11-15

李源祥告别友邦人寿董事长职位，中国市场版图持续扩张中

11-15

凌华智能两款工业计算机获台湾精品奖，创新设计与卓越性能获肯定

11-15

雷军自曝“睡车间”照片为摆拍，幽默回应网友催工

11-15

10月70城房价：一线二手房环比13个月首次转涨，各线新房房价跌幅收窄

11-15

国产新能源崛起，BBA中国市场遇冷，营收大跌如何应对？

11-15

矩阵起源双奖加持，智能操作系统MatrixOS引领AI与数据技术新浪潮

11-15

IAM闪耀第七届进博会，智慧健康家电引领新生活潮流

11-15

SSL端口详解：构建安全互联网通信的关键

11-15

万达商管负债近3000亿，王健林清空海外资产能否解困？

11-15

李彦宏发布“秒哒”应用：一句话生成，编程不再是门槛？

11-15

雷军车间睡觉照引热议：逗乐网友，称智驾将年底冲刺第一阵营