//
Grok 中会隐藏一些推理模型的“思考”过程。
埃隆·马斯克的人工智能公司 xAI 于周一晚些时候发布了其最新旗舰人工智能模型 Grok 3,并为 Grok 的 iOS 和网络应用程序推出了新功能。
Grok 是 xAI 对 OpenAI 的 GPT-4 和谷歌的 Gemini 等模型的回应,能够分析图像并回答问题,并为马斯克的社交网络 X 上的多个功能提供支持。Grok 3 已经开发了数月,并曾乐观地计划于 2024 年发布,但未能按时推出。
周一的发布显得雄心勃勃。
xAI 在孟菲斯的一个庞大数据中心中使用了大约 20 万个 GPU 来训练 Grok 3。马斯克在X 上发布的一篇帖子中声称,Grok 3 的开发使用了比其前身 Grok 2 多 10 倍的计算能力,并采用了扩展的训练数据集,其中可能包括法庭文件。
“Grok 3 比 Grok 2 强大了一个数量级,”马斯克在周一的直播演示中表示。“这是一个追求绝对真理的人工智能,即使这种真理有时与政治正确相冲突。”
Grok 3 实际上是一个模型家族。Grok 3 迷你版是一个较小的版本,它以牺牲一些准确性为代价,能够更快地回答问题。目前,并非所有 Grok 3 的模型及相关功能都已上线(部分功能仍处于测试阶段),但它们已于周一开始逐步推出。
xAI 声称,Grok 3 在包括 AIME(评估模型在数学问题上的表现)和 GPQA(使用博士级别的物理、生物和化学问题评估模型)的基准测试中超越了 GPT-4o。根据 xAI 的说法,Grok3 的早期版本还在 Chatbot Arena 中取得了具有竞争力的评分。Chatbot Arena 是一个众包测试平台,不同的 AI 模型相互竞争,用户会投票选择他们更喜欢的回答。
新推出的 Grok 3 模型有两种变体:Grok 3 Reasoning 和 Grok 3 mini Reasoning,它们能够像 OpenAI 的 o3-mini 和中国人工智能公司 DeepSeek 的 R1 这样的“推理”模型一样,仔细“思考”问题。推理模型会在给出结果之前尝试自我事实核查,从而避免一些通常会绊倒其他模型的陷阱。
xAI声称,Grok 3 Reasoning在多个流行的基准测试中超越了o3-mini的最佳版本——o3-mini-high,其中包括一个名为AIME 2025的较新的数学基准测试。
这些推理模型可以通过 Grok 应用程序访问。用户可以要求 Grok 3 进行“思考”,或者对于更复杂的问题,使用“超级大脑”模式,该模式会调用额外的计算能力来进行推理。xAI 将推理模型描述为最适合数学、科学和编程问题。
马斯克表示,为了防止知识提取(distillation)——一种 AI 模型开发者从其他模型中提取知识的方法,Grok 应用程序中会隐藏一些推理模型的“思考”过程。最近,DeepSeek 被指控通过提取 OpenAI 模型的知识来创建自己的模型。
Grok 的推理模型支持了 Grok 应用程序中的一个新功能——DeepSearch,这是 xAI 对 OpenAI 的深度研究工具(deepresearch)的回应。DeepSearch 会在互联网和 X 平台上扫描信息,并在回答问题时提供一个摘要。
X 平台的 Premium+ 订阅用户(每月 50 美元)将首先获得对 Grok 3 的访问权限,而其他功能将被限制在一个名为 SuperGrok 的新计划中。根据泄露的信息,SuperGrok 的定价为每月 30 美元或每年 300 美元,它将解锁额外的推理和 DeepSearch 查询,并提供无限的图像生成功能。
马斯克表示,未来——大约在一周后——Grok 应用程序将增加“语音模式”,为 Grok 模型提供合成语音。在此之后的几周内,Grok 3 模型将通过 xAI 的企业 API 提供,同时还将提供 DeepSearch 功能。
马斯克还提到,xAI 计划在未来几个月内开源 Grok 2。
“我们的总体方法是,当新版本完全推出后,我们会开源上一个版本。”他继续说道,“当 Grok 3 成熟且稳定时,可能在未来几个月内,我们就会开源 Grok 2。”
两年前马斯克首次宣布 Grok 时,他将这款人工智能模型定位为大胆、未经筛选且反“觉醒”(anti-“woke”)——总体而言,它愿意回答其他 AI 系统不愿涉及的争议性问题。他在一定程度上兑现了这一承诺。例如,当被要求使用粗俗语言时,Grok 和 Grok 2 会欣然从命,说出你可能从未从 ChatGPT 那里听到的色彩斑斓的言辞。
然而,在 Grok 3 之前,Grok 模型在政治话题上有所保留,并不会跨越某些界限。事实上,一项研究发现,Grok 在跨性别权利、多元化项目和平等问题上倾向于左倾立场。
马斯克将这种倾向归咎于 Grok 的训练数据——公开网页内容,并承诺要“将 Grok 调整得更接近政治中立”。目前还不清楚 xAI 是否已经实现了这一目标,以及可能会带来什么后果。(TechCrunch)
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。