马斯克旗下xAI发布Grok 3 自称超越GPT-4o、DeepSeek-v3

2025年2月18日 12人浏览 / 0人评论 / 添加收藏

2月18日消息,今日,马斯克旗下人工智能公司xAI发布了大模型Grok 3。

在大模型能力方面,在数学推理、科学逻辑推理和代码写作上,Grok-3在多项benchmark测试中均取得了比DeepSeek-v3、GPT-4o、Gemini-2 pro更优的效果。

在AIME'24数学能力测试中,Grok-3取得了52分,明显高于DeepSeek-V3的39分。

在GPQA科学知识评估中,Grok-3以75分的优异成绩领先DeepSeek-V3的65分。

此外,在LCB Oct-Feb编程能力测试中,Grok-3也以57分的成绩超越了DeepSeek-V3的36分。

据xAI官方介绍,Grok 3 在训练过程调用了 10 万个 Nvidia H100芯片,较前代产品 Grok 2 使用的 15000 个 GPU 实现了数倍的跨越式提升。(御风)

全部评论