近日,OpenAI发布了新的旗舰大模型GPT-4o,主打实时的视觉、语音、文本的多模态沟通,再度惊艳全球。
GPT-4o虽然属于一次小版本的升级,但却是一次重要的“进化”。发布会上,OpenAI展示很多新的应用场景,如实时陪伴、家庭教育、实时翻译等等。人们注意到,OpenAI的策略发生了显著变化:过去,他们有意让AI不同于人类。但如今,新版本ChatGPT则更像一名人类伙伴。这一变化的背后,是AI在情绪感知方面取得的重大进步。
传统大语言模型的情绪感知主要依靠文本分析。但文本信息量太少。微软首席执行官萨蒂亚·纳德拉曾表示:“人工智能的下一个前沿将是情感智能。”GPT-4o通过融合视觉、语音信息,让AI可以通过肢体语言完成实时的情绪感知,这不仅是技术上的突破,也意味着新的商业机会正在涌现。
情绪是商业的密码。抖音、拼多多、小红书等均深谙此道。借助多模态大模型技术,AI的情绪感知能力将普及化。更多企业可以将AI的情绪感知能力融入自己的产品,从而更好了解用户,改善用户体验,增强产品吸引力,并提高品牌忠诚度。
尤其是对许多硬件厂商而言,以智能手机、智能家居、新能源汽车、工业互联网等为代表的产品互联网化曾经为他们带来一波巨大的红利。如今智能化时代再次到来,将实时的视觉、语音等同现有的硬件结合,并佐以用户情绪感知能力,这将掀起一波更为巨大的行业变革浪潮。
在进化史中,视觉和情绪的出现对生命的进化至关重要。如今,AI智能体也在不断进化。这是技术的突破,也是我们的机遇!