2024年12月5日至20日,人工智能巨头OpenAI连续12天进行直播发布会,集中展示了其在AGI(通用人工智能)领域的最新进展。从重磅发布的满血版o1模型和ChatGPT Pro订阅服务开始,到备受期待的Sora Turbo视频生成模型,以及最终发布的新一代推理模型o3,OpenAI CEO山姆·奥特曼多次现身,引发业界广泛关注。
此次活动被解读为OpenAI在生成式AI市场竞争中,积极争取更大份额的策略。虽然受到一些赞誉,但也面临着内部变动、与微软合作关系紧张以及AGI进展争议等挑战。
具体发布内容如下:第一天,发布满血版o1模型,提升了推理能力和响应速度,并解锁多模态图像识别功能,同时推出ChatGPT Pro订阅服务;第二天,介绍强化学习微调技术(RFT),展示了小模型也能达到专家级水平的潜力;第三天,正式发布Sora Turbo,能够生成更长、更高清的视频,并支持多种编辑功能;第四天,升级Canvas功能,增强了用户与ChatGPT的协作能力;第五天,ChatGPT正式集成到苹果系统,用户可通过Siri访问ChatGPT功能;第六天,增强ChatGPT高级语音模式,提升多模态能力;第七天,发布Projects功能,方便用户管理文件和聊天记录;第八天,ChatGPT Search向所有用户开放;第九天,o1 API正式版发布,提供更强大的功能和更低的成本;第十天,推出ChatGPT热线服务;第十一天,ChatGPT桌面版新增跨应用访问功能;第十二天,发布新一代推理模型o3,推理能力大幅提升,支持多模式推理。此外,OpenAI还在圣诞假期期间为Plus用户提供Sora无限使用权限。
OpenAI的密集发布受到各方评价。一些评论指出Sora Turbo等产品虽然进步显著,但仍存在不足,例如对物理规律的理解不够完善;而o3模型虽然在推理能力方面取得突破,但距离真正的AGI还有距离。
总而言之,OpenAI的这12天密集发布,展现了其在AGI领域的积极探索和技术实力,但也面临着来自竞争对手(如谷歌、xAI)的激烈竞争以及自身发展中的挑战。 大模型的“烧钱”速度,以及对多模态、定制化、隐私等方面的关注,也体现出OpenAI在商业化和技术发展中的战略考量。