近日,谷歌对Gemini 2.5系列模型进行了更新,推出了包括Gemini 2.5 Pro稳定版、Gemini 2.5 Flash稳定版以及全新的Gemini 2.5 Flash-Lite预览版在内的多款模型,以满足不同用户在性能和成本方面的多样化需求。
各版本模型特点及定位
-
Gemini 2.5 Pro稳定版:性能强大,适合编程和高复杂度任务。其稳定版已全面可用,与6月5日的预览版相比没有变化,价格依然较高,每百万输入/输出token分别为1.25美元和10美元。
-
Gemini 2.5 Flash稳定版:性能介于Pro和Flash-Lite之间,适合对速度要求较高的日常任务,稳定版已全面可用,与5月20日的预览版相比无变化,但价格有所更新,每百万输入/output token分别为0.3美元和2.5美元,音频输入则为1美元。
-
Gemini 2.5 Flash-Lite预览版:这是新推出的轻量级模型,其性价比极高,主要面向“量大且注重成本效率的任务”。它支持多模态输入和100万token上下文,并且可以通过API参数动态控制思考预算。不过,默认情况下,其“思考”功能是关闭的,仅支持函数调用,但支持所有原生工具。在性能上,虽然整体表现略逊于2.5 Flash,但在AIME 2025和FACTS Grounding等部分指标上却有小幅领先优势。在价格上,2.5 Flash-Lite更具竞争力,其定价为每百万输入/output token分别为0.1美元和0.4美元,音频输入为每百万token 0.5美元。谷歌CEO Sundar Pichai在推文中表示,这是目前Gemini 2.5系列中最性价比的模型。
智能体恐慌现象与技术探索
在新发布的Gemini 2.5技术报告中,谷歌还提到了一种有趣的现象——“智能体恐慌”。在游戏场景中,当队伍中的宝可梦生命值或能量值较低时,Gemini 2.5 Pro会出现反复提醒治疗队伍或逃离地牢的情况,并且在持续的紧张状态下,可能会出现忘记使用探路工具等推理能力暂时下降的情况。
此外,DeepMind研究VP Oriol Vinyals展示了Gemini 2.5 Flash-Lite的一个惊艳应用——Neural OS/神经操作系统。这个看似正常操作系统的UI,其内容实际上是用户点击图标后由2.5 Flash-Lite实时生成的,具有非确定性特点,即每次进入同一文件夹,其内容可能都会有所不同。
用户体验与应用案例
在实际体验中,Datasette开发者Simon Willison通过博客分享了他对三个不同版本模型的使用感受。在生成鹈鹕骑自行车SVG的任务中,2.5 Flash-Lite在成本上表现最为出色,仅需0.0829美分,但输出token数相对较少。而在将Twitter Space录音转录成文本的测试中,2.5 Pro效果最佳,但2.5 Flash-Lite却中途卡住出现错误。
同时,谷歌开发者账号也分享了一些Gemini 2.5系列模型在辅助开发方面的实际应用案例。例如,@splinetool在其新的Hana工具中利用Gemini 2.5 Pro实现了通过自然语言生成对象和场景的功能,从而简化了复杂的3D设计工作流程。
总的来说,谷歌Gemini 2.5系列模型的更新,不仅在性能和成本方面提供了更多选择,还通过新的特性和功能探索了AI模型更多的应用场景和可能性。随着各版本模型在不同场景下的深入应用,我们有理由相信,AI技术将为我们的工作和生活带来更多的创新和变革。