百万 token 加持,谷歌 Gemini 2.5 Pro 正面对决 DeepSeek-R1
2025-03-27 15:10
元宇宙之心
2025-03-27 15:10
订阅此专栏
收藏此文章

‍‍‍‍     



在推出 Gemini 2.0 并见证 DeepSeek 崛起仅数月后,谷歌正式发布其“最智能模型”Gemini 2.5。这款新一代模型不仅具备强大的推理能力,在性能和准确性方面也实现了明显提升


距离谷歌发布上一代旗舰模型 Gemini 2.0 仅过去三个月,当时该系列首次引入了推理能力和智能体用例。


此次推出的 Gemini 2.5 Pro(实验版)已登陆 Google AI Studio 平台,Gemini Advanced 用户也可在聊天界面体验。同时,Vertex AI 平台即将同步上线。



谷歌 DeepMind 首席技术官 Koray Kavukcuoglu 在官方博客中表示:“Gemini 2.5 标志着我们在'打造更智能、更具推理能力的 AI'目标上迈出了重要一步。”


“通过大幅增强的基础模型与改进的后训练技术相结合,Gemini 2.5 实现了性能的全新突破。” Kavukcuoglu 表示,“未来我们将把这些思维能力直接植入所有模型,使其能够处理更复杂的问题,并支持更强大、更具情境感知能力的智能体。”



01.
更强大的上下文理解能力

与 Gemini 2.0 及 Gemini 2.0 Flash Thinking 一脉相承,Gemini 2.5 Pro 延续了“先思考后应答”的运作机制。


这款新模型能够处理文本、音频、图像、视频及大型数据集等多模态输入,并具备理解完整代码仓库的能力,可显著提升编程项目的开发效率。 


在实验性模型中,Gemini 2.5 Pro 提供了目前最广阔的上下文窗口,初始版本支持 100 万 token 的上下文长度,并将很快升级至 200 万 token


谷歌 AI Studio 产品经理 Logan Kilpatrick 在社交平台 X 上透露,该模型是“首个支持更高速率限制且开放商业计费的实验性模型”。  


谷歌表示,即将公布 Gemini 2.5 系列模型的详细定价方案。




02.
卓越的编程与推理性能

谷歌表示,该模型在高级推理基准测试中表现领先。公司指出,Gemini 2.5 Pro“在 GPQA 和 AIME 2025 等数学与科学基准测试中保持领先优势”。


Kavukcuoglu 特别提到,在旨在评估人类知识与推理能力的“Humanity's Last Exam”测试集中该模型“在不使用工具辅助的情况下取得了 18.8% 的顶尖成绩”


在编程任务方面,Gemini 2.5 Pro 同样展现出强劲实力,多项基准测试成绩超越前代 Gemini 2.0。

谷歌强调,新模型“尤其擅长开发视觉吸引力强的网页应用和智能体代码应用,同时在代码转换与编辑任务上表现突出”。这些进步使开发者能够更高效地构建复杂的编程项目。




03.
竞争日益激烈的市场

Gemini 2.5 Pro 的推出环境已与去年 12 月 Gemini 2.0 发布时大不相同。

DeepSeek 推出的推理大语言模型 DeepSeek-R1 证明,强大模型完全可以用更低的训练和计算成本实现优异性能。更重要的是,DeepSeek 展示了开源模型完全有能力与 OpenAI 的 o1、o3 等闭源大模型一较高下。

除了 DeepSeek 不断扩充的模型阵容,谷歌还需直面 OpenAI 推理模型的竞争。虽然 OpenAI 最新发布的 GPT-4.5 并非专注推理的模型,但业内普遍预期该公司很快将推出更多推理专用模型。

值得一提的是,Gemini 2.5 已是谷歌本月发布的第二款新模型。

三月初,该公司刚推出轻量级语言模型 Gemma 3 的最新版本,该模型支持 12.8 万 token 的上下文长度,特别适合移动端设备使用。这一连串动作显示出科技巨头们在 AI 赛道日益白热化的竞争态势。



原文来源于:

1.https://venturebeat.com/ai/google-releases-most-intelligent-model-to-date-gemini-2-5-pro/ 

中文内容由元宇宙之心(MetaverseHub)团队编译,如需转载请联系我们。






最新行业深度研究报告发放中! 资本实验室全新发布 37 页量化报告《 2023 全球区块链应用市场暨业图谱报告(2023) 》,收录 1000+ 应用案例 ,探索区块链应用趋势 , 入群即可免费领取 






XIN 科技周刊(3.15-3.21)
从足球场到太空
这些机器人也太厉害了

麦肯锡预测:生成式 AI 或为零售业创造 4.4 万亿美金,解读 9 大核心场景


英伟达 AI 超级军团来了!黄仁勋放话:AI 算力需求将暴增 100 倍

科技守护餐桌:AI 会是餐饮业的终极答案吗?



【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

元宇宙之心
数据请求中
查看更多

推荐专栏

数据请求中
在 App 打开