如何评价google于6月5日发布的gemini2.5pro 0605版本?和之前的版本有什么不同?
大声喊出:遥遥领先!!! 先说总结:一点意外都没有,因为它几乎是所有主流榜单的No.1。
一、Gemini的榜单成绩
先来看一下它的的榜单表现:
- 语言理解与对话能力(LMArena 第一)
- 网页编程与前端开发能力(WebDevArena 第一)
- 复杂、多语言代码生成能力(Aider Polyglot 第一)
- 学术/推理类问题解决能力(GPQA + HLE 第一)

这个榜单是测试上下文深度理解,Gemini的得分一骑绝尘,在192k的上下文得分是90.6分,比o3的58.1整整多了30多分。
同时新版Gemini的 Elo评分较上一个版本提升了24分,虽然提升的数据较少,但这个榜单的No.1的含金量可不不小。

Elo评分的运行机制是采用匿名投票的方法,大家在平台上向两个匿名的AI模型提出相同的问题,进行对比,谁的效果好就投谁。 换句话说,这个榜单的得分是大家一票一票投出来的。
二、gemini2.5pro 0605和之前的版本有什么不同
1. 更强更快
更强这一块从榜单的成绩看得出来,而且在Google AI Studio使用的时候,发现它的速度明显变快了不少,不知道是不是错觉。
2. 响应风格优化
Google 针对用户反馈,特别优化了模型的表达风格和格式控制能力。
- 更有条理的结构:回答更清晰,适合生成报告、说明书、教程。
- 更强的创意表达:支持文学风格、内容改写、广告文案等多样需求。
- 响应格式更专业:可生成带结构的列表、代码块、引用,更适用于工程场景。

三、总结
总的来说,此次Gemini 2.5 Pro的升级实在是太快了,仅过去一个月,就来一波。
而且大家注意到关于ChatGPT最新的拉新活动,OpenAI明显就坐不住了,新用户首月1美刀就可以开通ChatGPT的Team会员,而且还是5个席位,之前如果大家要开通5个席位,得花费150刀,而现在就1刀。
如果还没有薅的赶紧薅,不确定多久这个活动就下架了,申请资料我已经整理好了,感兴趣的可以去看看。
相关阅读:如何花费一美金就可以开通ChatGPT Team版会员(保姆级教程)
OpenAI此次活动针对的是谁?那肯定就是Google了,它们的积怨是最多的。