行情中心 沪深京A股 上证指数 板块行情 股市异动 股圈 专题 涨跌情报站 盯盘 港股 研究所 直播 股票开户 智能选股
全球指数
数据中心 资金流向 龙虎榜 融资融券 沪深港通 比价数据 研报数据 公告掘金 新股申购 大宗交易 业绩速递 科技龙头指数

传播文化业:豆包实时语音大模型上线 AI交互水平

国泰君安证券股份有限公司 01-21 00:00

上海电影 -1.71%

本报告导读:

豆包实时语音大模型上线,该模型一举实现理解情绪、联网、控制语气语调、随时打断等效果,交互水平的提升对于 AI软硬件场景落地都将是显著帮助。

投资要点:

事件:1月20 日,豆包实时语音大模型正式推出,并在豆包APP 全量开放。

该模型可理解输入语言情绪、实时联网,在输出时具备强大声音控制能力,且高度近似人类、有超低延迟、可随时打断。其真人级语音对话能力具体表现在以下方面:1)拟人化的情感承接,能够理解用户的内容及情绪,并用恰当的语气做出回应;2)强大的声音控制和丰富的情感演绎能力,能够遵循丰富的复杂指令,配合不同的音色、情绪及状态输出,可以讲故事、讲方言和口音、甚至唱歌;3)智商与表现力之间的平衡,该模型的表现力高度接近真人,包括类人的语气词、停顿思考等,模型也有实时联网功能,使其能够根据问题,动态获取最新信息,对时效问题给到精准、及时的回应;4)丝滑的交互体验和超低延迟,实现在更低系统时延情况下的生成准确性、自然度,并且具有敏锐的语音打断与用户对话判停能力。

豆包实时语音大模型的整体满意度较GPT-4o 有明显优势,特别是在语音语气自然度和情绪饱满度方面远高于后者。豆包团队围绕拟人度、有用性、情商、通话稳定性、对话流畅度等多个维度选取数十名外部测试者进行考评,豆包实时语音大模型整体满意度(以5分为满分)得分为4.36,GPT-4o 为3.18,超过半数的测试者对豆包模型表现打出满分,且豆包模型在情绪理解和情感表达方面优势明显,尤其在“一听就是AI 与否”的评测中被认为AI 的概率极低。

我们认为,增加了情感的语音交互将显著有利于AI 的软硬件应用,能够降低使用门槛、改进效率、提升体验,包括如下应用场景:1)情感陪伴与智慧教育应用,推荐恺英网络(EVE AI),受益标的盛天网络、南方传媒、世纪天鸿、昆仑万维;2)AI 陪伴硬件如AI 玩具、AI 宠物,可帮助硬件生产商与IP 方扩大需求,推荐上海电影,受益标的汤姆猫;3)AI 眼镜、AI 耳机、AI 音箱等生活效率产品将受益于交互方式的改进,受益标的小米集团。

风险提示:AI 应用落地进度不及预期,商业化进展不及预期,相关公司主营业务业绩压力。

免责声明

以上内容仅供您参考和学习使用,任何投资建议均不作为您的投资依据;您需自主做出决策,自行承担风险和损失。九方智投提醒您,市场有风险,投资需谨慎。

推荐阅读

相关股票

相关板块

  • 板块名称
  • 最新价
  • 涨跌幅

相关资讯

扫码下载

九方智投app

扫码关注

九方智投公众号

头条热搜

涨幅排行榜

  • 上证A股
  • 深证A股
  • 科创板
  • 排名
  • 股票名称
  • 最新价
  • 涨跌幅
  • 股圈