行情中心 沪深京A股 上证指数 板块行情 股市异动 股圈 专题 涨跌情报站 盯盘 港股 研究所 直播 股票开户 智能选股
全球指数
数据中心 资金流向 龙虎榜 融资融券 沪深港通 比价数据 研报数据 公告掘金 新股申购 大宗交易 业绩速递 科技龙头指数

计算机行业动态研究:GPT-4O、GEMINI新品接连发布 多模态技术奇点加速到来

国海证券股份有限公司 05-17 00:00

事件:

2024 年5 月14 日,OpenAI 在官网正式发布新旗舰模型GPT-4o 多模态大模型,其中o 代表的是omni,即“全能”,GPT-4o 可以实时对音频、视觉和文本进行推理,相较于GPT-4 Trubo 速度更快、价格更便宜。

2024 年5 月15 日,2024 年谷歌I/O 大会正式召开,会上谷歌将搜索业务做了最彻底的AI 改造, 更新升级了Gemini1.5Pro 版本, 推出Gemini1.5Flash 轻量化小模型、生成视频模型Veo、AI 智能体ProjectAstra,并展示了与GPT-4o 相似的语音视觉交互功能Gemini Live。

投资要点:

GPT 持续迭代,GPT-4o 推动人机交互再上新台阶OpenAI 持续升级GPT 版本,2023 年3 月发布GPT-4 在图片识别、图文数据综合处理及逻辑推理等能力实现质变;2023 年11 月发布GPT-4Turbo,支持125 万tokens 的同时也在上下文等多个领域实现显著进步。本次发布GPT-4o 带来各种能力升级:

①多模态交互,具有更优质的视频和音频理解以及图像生成能力:

GPT-4o 能够接受文本、音频和视频的任意组合作为输入,并生成文本、音频和图像的任意组合作为输出。与现有模型相比,GPT-4o 在视觉和音频理解方面有更好的表现;在理解和生成图像方面的能力优于现有模型,能完成过往模型无法完成的任务。

②情绪感知:GPT-4o 能够结合视频和音频感受对话者的情绪,并给出充满人类情感的反馈。例如:在根据工作人员要求讲故事时,工作人员可以随时插话打断并提出新要求,GPT-4o 能几乎毫无停顿地接上话题并按照要求变化音色、语调、情感等。

③毫秒级响应:GPT-4o 对音频输入的响应时间可以快到232 毫秒,平均为320 毫秒,这与人类在对话中的响应时间相近,此前GPT-4 的语音响应约5.4 秒。

④性能&成本优势:在传统基准测试中,GPT-4o 在文本、推理和编码智能方面,达到了GPT-4 Turbo 级别的性能,同时在多语言、音频和视觉能力方面创下了新高。相比GPT-4 Turbo,GPT-4o 推理速度提升2倍的同时,价格降低50%。

打造全新GPT 语音助手且免费开放,合作苹果&微软加速端侧落地OpenAI 通过GPT-4o 打造的语音版ChatGPT 助手,当前已在ChatGPT 中开放使用,同时模型API 同步放出。GPT 语音助手主要功能包括与用户跨音频、视频进行交流,例如,让GPT-4o 进行实时翻译、唱歌、做数学题、讲笑话等。未来,OpenAI 将会在ChatGPT Plus 中推出新版语音模式GPT-4o 的alpha 版。

OpenAI 与苹果合作,加速ChatGPT 在端侧落地。OpenAI 宣布推出一款适用于macOS 的桌面级应用,使用键盘快捷键就可向ChatGPT提问。用户可通过电脑与ChatGPT 语音对话,GPT-4o 的新音频和视频功能后续将推出。据《每日经济新闻》援引彭博社5 月10 日报道,苹果被曝正与OpenAI 敲定一项协议,今年将后者的部分技术引入iPhone。

借此苹果将能提供由ChatGPT 支持的“聊天机器人”,作为iOS 18 中人工智能功能的一部分。

谷歌发布Project Astra、Veo 等,多模态技术奇点加速到来2024 年5 月15 日凌晨,Google I/O 开发者大会上发布了通用AI 智能体Project Astra,可实现跨文本、音频、视频多模态实时推理。同时,谷歌正式发布一款全新的视频生成模型Veo,谷歌声称,Veo 能够根据文本、图像创建超过60 秒的高质量1080P 视频,用户可以对光照、镜头语言、视频颜色风格等进行设定。

我们认为,OpenAI、谷歌等新品的推出,体现出多模态大模型技术的持续升级,GPT-4o 的发布将革新人机交互模式,推动大模型在终端加速推广。随着多模态技术奇点加速到来,未来基于大模型的创新应用将更值得期待,大模型技术将全面赋能教育、办公等行业和场景。

行业评级及投资策略:GPT-4o、Gemini 新品陆续发布,多模态大模型技术奇点加速到来,大模型的商业价值、AI 应用的创新突破以及AI 算力需求的持续增长可期,维持对计算机行业“推荐”评级。

相关个股:

(1)大模型:科大讯飞、三六零、拓尔思、云从科技;(2)AI 应用:金山办公、万兴科技、福昕软件、焦点科技、虹软科技、彩讯股份、佳发教育、鸥玛软件、拓维信息;(3)AI 终端:华勤技术、软通动力、海康威视、大华股份、芯海科技、联想集团、飞荣达;

(4)AI 算力:浪潮信息、工业富联、中科曙光、神州数码、紫光股份、中际旭创、沪电股份、新易盛、海光信息、寒武纪等。

风险提示:宏观经济影响下游需求、大模型发展不及预期、市场竞争加剧、中美博弈加剧、相关公司业绩不及预期等。

免责声明

以上内容仅供您参考和学习使用,任何投资建议均不作为您的投资依据;您需自主做出决策,自行承担风险和损失。九方智投提醒您,市场有风险,投资需谨慎。

推荐阅读

相关股票

相关板块

  • 板块名称
  • 最新价
  • 涨跌幅

相关资讯

扫码下载

九方智投app

扫码关注

九方智投公众号

头条热搜

涨幅排行榜

  • 上证A股
  • 深证A股
  • 科创板
  • 排名
  • 股票名称
  • 最新价
  • 涨跌幅
  • 股圈