GPT-4o是近年Open AI发布的最“聪明”的大模型,将改善情感类、效率类和安全类等场景的应用,对部分行业应用带来一定影响。
GPT-4o将升级教育、客服、商业分析等行业应用,成为高度逼真且有情感的“真人”AI助理。
GPT-4o具备较强的记忆和逻辑能力,通过对用户过往交互信息推理分析,可为用户“量身定制”交互方式和习惯,充分理解对话内容并可自主发表建议,同时也支持与多用户同时实现交互。另外,用户可实时打断和转移与大模型的交互话题,使AI陪伴更加真人、可靠和多样。最近在国外一个对盲人陪护所发布的视频中,GPT-4o可有效助力盲人用户出行,实时交互所处的环境信息细节,场景描述,丰富盲人的情感生活,同时也可为盲人用户实时打车,提高出行效率。
GPT-4o大模型升级智能座舱用户交互体验,助力自动驾驶实时建图、增强感知并缩短推理时间。
GPT-4o将改善并升级智能座舱用户交互效果,促进“人机交流”向“人与真人交流”过度。此外,当前大模型对自动驾驶的帮助重点集中在仿真训练场景的搭建与扩充,实现更精确的自动化标注等,对较复杂且高动态的道路环境通常无法较快的响应,难以实时生成准确有效的规划和决策。一方面GPT-4o可提高实时城市NOA(Navigate on Autopilot 驾驶辅助系统)建图生成效率,使车辆减少对高精地图的依赖。另一方面相比传统多模态大模型视觉感知结果需通过文字转换输入神经网络,视觉感知结果直接输入神经网络使信息细节更加丰富,可将车辆所处的环境信息进行精准分层和分类,使自动驾驶系统在处理驾驶动作时进行更好的任务优先级排序,保持最优驾驶决策逻辑,更贴合人类驾驶思维。此外,整合成一个神经网络的多模态大模型可实现推理加速降低时延,实时感知道路环境,及时推理分析周围障碍物信息、其他交通参与者意图等,在一定程度上将提高低速自动驾驶的安全性。
GPT-4o大模型将提升无人机出行效率和安全,促进低空经济发展。
当前接入传统多模态大模型的物流无人机由于自身电量有限,在实际处理任务时,往往由于大模型规划和推理任务时间过长,易出现尚未完成任务就返回充电等问题,GPT-4o将在单位时间内帮助无人机完成更多的推理任务。此外,无人机在复杂场景环境飞行也易发生与障碍物碰撞或因任务规划错误而出现炸机等问题,GPT-4o在确保无人机实现高正确率路径规划的同时,其推理加速在一定程度上也确保了无人机的飞行安全,使无人机在复杂环境飞行避障更加“灵巧”,满足无人机飞行的可靠性和安全性。
GPT-4o大模型将强化人形机器人应用,升级人形机器人“类人情感“。
一方面GPT-4o使人机交互变快,机器人可迅速根据需求规划自身任务,使部分身体动作更接近人类的反应速度。另一方面机器人将增强情感功能,可区分多人对话,判断对话人的精神状态并生成更好的语言反馈。