北京时间5月14日凌晨,OpenAI发布了可实时进行音频、视觉和文本推理的新一代AI模型GPT-4o,并将推出PC桌面版ChatGPT。
据介绍,GPT-4o里的“o”是Omni的缩写,也就是“全能”的意思。相比去年11月发布的GPT-4-turbo,GPT-4o价格下降50%,速度提升200%。未来几周内,GPT-4o语音和视频输入功能也将随之推出。
对于此次发布,此前有传言会是全新的智能搜索能力产品发布,但此次OpenAI并没有带来新的AI搜索产品,而是虚晃一枪后发布了升级后的GPT-4o。有业内专家认为,GPT-4o的多模态能力只是看起来很好,实际上OpenAI并未展示对于视觉多模态的突破功能。在实时音频交互方面,国内诸如豆包、文心一言等产品也已具备类似的功能。
点评:既不是GPT-5也不是大模型搜索产品,在技术迭代竞赛上,强如OpenAI也开始遇到瓶颈了。