行情中心 沪深京A股 上证指数 板块行情 股市异动 股圈 专题 涨跌情报站 盯盘 港股 研究所 直播 股票开户 智能选股
全球指数
数据中心 资金流向 龙虎榜 融资融券 沪深港通 比价数据 研报数据 公告掘金 新股申购 大宗交易 业绩速递 科技龙头指数

计算机行业GENAI系列(九):GPT-4O图像生成模型优化 效果超预期

广发证券股份有限公司 03-31 00:00

事件:根据OpenAI 官网,2025 年3 月25 日,OpenAI 推出GPT-4o的图像生成功能,能够通过原生多模态模型生成准确逼真的图像,有望带来新的增长契机,但在商业落地过程中仍面临技术可用性(模型效果是否符合用户预期)与规模化盈利(需平衡成本与收益)双重挑战,因此技术价值的最终锚点仍需回归商业验证。

GPT-4o 的图像生成能力基于自回归模型而构建,整合多模态数据+联合训练学习跨模态关系,效果较佳。与基于扩散模型的DALL·E 不同,GPT-4o 的图像生成能力基于原生内置于ChatGPT 中的自回归模型而构建,此外,原生整合了文本、图像、代码等多模态数据,采用端到端的架构进行联合训练,使模型能直接学习到文本描述与图像元素的对应关系等跨模态关联性。

算力端,推理时间延长+调用量增加,反映投入仍具备可持续性。虽未直接披露模型训练成本,具体成本仍有待披露与评估,但GPT-4o 模型图像生成功能的训练路径优化反映了大模型在预训练投入仍具备可持续性。由于GPT-4o 模型所创建的图片更为详细精准,因此需要更长的渲染时间。但由于用户大量调用导致算力需求激增,生成速度明显变慢。Sam Altman 官方社媒账号称,由于用户的使用热情远超预期,ChatGPT 的图像生成能力需要暂时受到限制。尽管端到端的模型架构降低了系统复杂度,但生成前的推理时间延长,叠加生成效果改善带来的调用需求量增加,将带来更多的算力需求,同样反映了投入的可持续性。

模型端,从模块化到原生多模态,模型统一化是未来趋势;期待国产模型对标。GPT-4o 的图像生成不再依赖于独立的视觉编码器或扩散模型模块,而将图像生成内化为语言模型的原生能力,通过端到端架构实现文本、图像等模态的联合表征对齐,体现了模型融合的未来趋势。

此外,多模态能力持续提升背景下,国产多模态模型进度较快,期待国内模型厂商的对标发布。

应用端,从辅助工具升级为生产力引擎,加速垂直领域价值落地。

GPT-4o 的图像生成功能效果较佳,从“美工”级别跃升至具备“半专业”级别,有望支撑在广告营销、影视制作等领域的成熟应用,使得AI 技术从辅助工具升级为生产力核心,并加速垂直领域价值落地。

多模态大模型革新正促进建立“算力需求增长、模型能力跃迁、应用场景渗透”的正向循环。建议关注三条投资主线:算力基建(寒武纪、紫光股份、浪潮信息、神州数码、宝信软件)、AI 工具/平台(第四范式、星环科技)、多模态AI 应用(万兴科技、金山办公、福昕软件、光云科技、科大讯飞)。

风险提示。内容版权风险;GenAI 应用落地不及预期;商业生态冲击。

免责声明

以上内容仅供您参考和学习使用,任何投资建议均不作为您的投资依据;您需自主做出决策,自行承担风险和损失。九方智投提醒您,市场有风险,投资需谨慎。

推荐阅读

相关股票

相关板块

  • 板块名称
  • 最新价
  • 涨跌幅

相关资讯

扫码下载

九方智投app

扫码关注

九方智投公众号

头条热搜

涨幅排行榜

  • 上证A股
  • 深证A股
  • 科创板
  • 排名
  • 股票名称
  • 最新价
  • 涨跌幅
  • 股圈