9月12日,OpenAI 发布了新模型:o1-preview。
对新模型,OpenAI寄予很高的期望,取名o1,或许在暗示一个AI新纪元的开始。
与之前的模型相比,o1-preview强调深度思考,能在面对复杂任务时更好地推理和自我纠错。它给出了大语言模型开发的一种新范式。作为一种新的推理模型,它专为解决复杂问题设计,特别在科学、编程和数学领域表现卓越。例如:在美国数学邀请赛(AIME)等测试中表现优异,正确率达83%。
除此之外,许多AI开发者认为,新模型的特性使它可以在更多场景中提供可能性,包括:增强推理和问题解决、智能体系统和编码、多模式应用、更具有成本效益的 AI 部署、与外部工具和插件集成、持续学习和更新、教育和培训、复杂系统管理等。
但也要注意,o1 还是GPT4系列模型之一,而且相对于 GPT-4o 也有些不足之处:
- 暂时不支持网络浏览和图片分析。
- 自然语言生成能力较弱,在文章撰写和创意任务上不如 GPT-4o。
- 不适合所有任务场景,尤其在非推理任务中表现逊色。
- 任务适应性较窄,更专注于特定领域(数学、编程),不如 GPT-4o 通用。
- 自然语言推理和知识整合能力较弱,在跨学科或复杂语言推理上不如 GPT-4o。
目前,这个新模型已经在ChatGPT和API上线,用户可以通过模型选择器使用o1-preview。