事件:OpenAI 5 月14 日春季发布会推出GPT-4 的迭代版本——GPT-4o,该模型具备更强的实时语音功能和更快的运行速度,并免费向公众开放。
GPT-4o 可在同一个神经网络中处理文本、语音和视觉信息GPT-4o 可接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像的任意组合输出,从而用户交互体验更自然简单。而此前的ChatGPT语音模式由三个独立模型组成,其输入和输出并非在同一神经网络中处理完成,从而丢失大量信息如无法直接观察音调、背景噪音,无法表达情感等。
语音模式具备“实时”响应功能,感知用户情绪功能GPT-4o 的语音模式最快可在232 毫秒的时间内响应音频输入,平均响应时间为320 毫秒,已经接近人类在交谈的响应时间,用户可与模型进行真人聊天,在模型回应过程中打断、并提出更多要求,无需等待模型完成上一个问题回复后再提出新的问题。此外,GPT-4o 可识别用户声音中展现的情感,并根据用户需求来使用不同情感风格的声音。
GPT-4o 将免费开放,付费用户消息数量上限比免费用户多5 倍此前免费用户只能使用GPT-3.5,GPT-4o 将对所有用户免费开放,免费用户的可发送消息数量达到上限则会被强制退回到3.5 版本。付费用户可使用的消息数量上限比免费用户多5 倍。
API 效率更高、速度更快、费用更低
相较于GPT-4 Tubo,GPT-4o API 速度提升2 倍,费用便宜50%,速率上限提升5 倍,最高可达每分钟1000 万token。
我们认为此次OpenAI 发布的GPT-4o 在用户的易用性、体验度上实现了大幅提升,随着未来模型日渐升级迭代,对算力、互联的需求将持续,国内光模块厂商有望进一步受益AI 发展。
推荐标的:中际旭创、天孚通信、新易盛、源杰科技(电子组联合覆盖)、博创科技、仕佳光子、光库科技、长光华芯、铭普光磁。建议关注:光迅科技、太辰光、罗博特科、腾景科技。
风险提示:行业竞争加剧;中美贸易摩擦升级;原材料缺货涨价影响超预期等。