谷歌Gemini新版逆袭,力压o1登顶AI竞技场,能否持续领跑?

   发布时间:2024-11-15 13:00 作者:陆辰风

在AI竞技场的风云变幻中,谷歌新模型Gemini(Exp 1114)以黑马姿态震撼登场,一举夺得总榜冠军,引发业界广泛关注。

经过6000余名网友的匿名投票,Gemini不仅在数学领域与学霸级模型o1并驾齐驱,更在其他五个单项上独占鳌头。这一成绩公布后,谷歌CEO皮猜亲自站台祝贺,竞技场官方也第一时间发来贺词,称赞这一非凡成就。

Gemini的崛起,无疑打破了此前关于谷歌AI发展遭遇瓶颈的传言。其强大的实力,甚至让业界猜测,或许只有OpenAI推出满血版o1,方能与之抗衡。目前,新模型已在谷歌AI Studio上线,供用户体验,官方后续还将提供API接口。

从竞技场排名来看,Gemini的分数直线飙升40余分,成功挤下了一直占据榜首的OpenAI模型,包括o1-preview和GPT-4o。在单项比拼中,Gemini同样表现出色,一举夺得复杂提示、数学、创意写作、指令遵循、长查询处理和多轮对话等六个单项第一。

尤为Gemini在数学能力上与o1难分伯仲。据OpenAI官方介绍,o1无需专门训练即可夺得数学奥赛金牌,甚至能在博士级别的科学问答中超越人类专家。然而,Gemini却能在这一领域与之并驾齐驱,展现出其强大的数学处理能力。

尽管在写代码和风格控制方面,Gemini未能挤进前三,但在视觉能力上却夺得第一,超越了GPT-4o。这一成绩,无疑让业界对Gemini的未来充满期待。

然而,Gemini的上线也引发了一些争议。有网友指出,其32k的上下文窗口相比Gemini 1.5的200万上下文窗口有所缩水。对此,谷歌AI Studio负责人表示将尽快进行更新。在用户体验方面,虽然Gemini在某些问题上表现出色,但仍有翻车现象发生,如回答物理问题时出现错误等。

尽管存在争议,但Gemini的崛起无疑为AI竞技场注入了新的活力。其强大的实力和多样的功能,让业界对谷歌AI的未来充满期待。用户可通过谷歌AI Studio体验Gemini,感受其带来的全新AI体验。

 
 
更多>同类内容
全站最新
热门内容
本栏最新
 
智快科技微信账号
ITBear微信账号

微信扫一扫
加微信拉群
电动汽车群
科技数码群