如何评价google于6月5日发布的gemini2.5pro 0605版本?和之前的版本有什么不同?

大声喊出:遥遥领先!!! 先说总结:一点意外都没有,因为它几乎是所有主流榜单的No.1。

一、Gemini的榜单成绩

先来看一下它的的榜单表现:

  • 语言理解与对话能力(LMArena 第一)
  • 网页编程与前端开发能力(WebDevArena 第一)
  • 复杂、多语言代码生成能力(Aider Polyglot 第一)
  • 学术/推理类问题解决能力(GPQA + HLE 第一)
Gemini 2.5 成绩榜单

这个榜单是测试上下文深度理解,Gemini的得分一骑绝尘,在192k的上下文得分是90.6分,比o3的58.1整整多了30多分。


同时新版Gemini的 Elo评分较上一个版本提升了24分,虽然提升的数据较少,但这个榜单的No.1的含金量可不不小。

Gemini的 Elo评分再创新高

Elo评分的运行机制是采用匿名投票的方法,大家在平台上向两个匿名的AI模型提出相同的问题,进行对比,谁的效果好就投谁。 换句话说,这个榜单的得分是大家一票一票投出来的。

二、gemini2.5pro 0605和之前的版本有什么不同


1. 更强更快

更强这一块从榜单的成绩看得出来,而且在Google AI Studio使用的时候,发现它的速度明显变快了不少,不知道是不是错觉。

2. 响应风格优化


Google 针对用户反馈,特别优化了模型的表达风格和格式控制能力。

  • 更有条理的结构:回答更清晰,适合生成报告、说明书、教程。
  • 更强的创意表达:支持文学风格、内容改写、广告文案等多样需求。
  • 响应格式更专业:可生成带结构的列表、代码块、引用,更适用于工程场景。
Gemini上下文能力再提升

三、总结

总的来说,此次Gemini 2.5 Pro的升级实在是太快了,仅过去一个月,就来一波。

而且大家注意到关于ChatGPT最新的拉新活动,OpenAI明显就坐不住了,新用户首月1美刀就可以开通ChatGPT的Team会员,而且还是5个席位,之前如果大家要开通5个席位,得花费150刀,而现在就1刀。

如果还没有薅的赶紧薅,不确定多久这个活动就下架了,申请资料我已经整理好了,感兴趣的可以去看看。

相关阅读:如何花费一美金就可以开通ChatGPT Team版会员(保姆级教程)

OpenAI此次活动针对的是谁?那肯定就是Google了,它们的积怨是最多的。

类似文章

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注