2 月 18 日消息,OpenAI 首席执行官萨姆・奥尔特曼于当地时间 2 月 17 日在 X 社交平台上发文,就公司下一个开源项目的方向征询公众意见。他提出了两种可能的开源模型方向:一种是“相当小但仍需在 GPU 上运行的 o3-mini 级模型”,另一种则是“尽可能优化的手机大小模型”。这或许意味着 OpenAI 即将开源新的大模型,也将是 2019 年 OpenAI 开源 GPT-2 之后再次开源某个大模型。
注意到,奥尔特曼在 1 月 31 日 Reddit 的“问我任何事”活动中,被问及 OpenAI 是否会公开部分 AI 模型技术并发布更多系统工作原理的研究时,他表示公司内部正在讨论这种可能性,并反思了 OpenAI 在开源方面的过往立场。他承认,OpenAI 此前在开源策略上可能“站在了历史的错误一边”,并称需要制定不同的开源策略。不过他也指出,公司内部并非所有人都认同这一观点。
2015 年成立后,OpenAI 曾表示会在符合公众利益的情况下公布其模型的研究和数据。但后来出于竞争压力和对信息披露可能带来的安全风险的担忧,公司转向了专有模型的开发。
然而,近期 AI 科技行业的新变化似乎促使 OpenAI 重新审视其开源策略。DeepSeek 的横空出世,以其低成本和开源模式迅速吸引了众多用户,其大模型 DeepSeek-R1 仅用两个月完成训练,成本仅为 550 万美元,相比之下,OpenAI 等公司的同类项目成本要高出许多。自 ChatGPT 于 2022 年年底推出后,许多 AI 公司为保持竞争力,选择不公开过多技术细节。但如今,随着 DeepSeek 等开源技术的兴起,部分开发者和客户可能会转向更具性价比的开源解决方案。(远洋)
智玩元宇宙微信公众号
全部评论