事件:3 月23 日-3 月24 日,2024 全球开发者先锋大会(GDC)在上海举行。多项国产大模型、数据和智能硬件等最新产品在大会首发,包括:上海人工智能实验室发布大模型训练数据集万卷2.0;阶跃星辰发布Step 系列通用大模型,包括 Step-1 千亿参数语言大模型、Step-1V 千亿参数多模态大模型以及Step-2 万亿参数MoE 语言大模型预览版等。此外,据阿里云,会上阿里云魔搭社区发布首个开源多模态数据处理系统Data-Juicer,可大幅提升视频数据处理效率和质量,以开源工具助力国产多模态大模型的探索。
政府政策支持为国产大模型及人工智能产业发展构建更良好的生态。
本次大会由上海市经信委等部门指导,上海市人工智能行业协会等机构主办,体现上海政府对国产大模型及人工智能产业的大力支持。此外,上海发布了支持大模型的一系列政策,为开发者们构建了更为良好的生态环境。
关注国产大模型能力升级及优质语料数据的商业价值兑现。近期国产大模型在长文本、多模态等方向积极拓展,月之暗面Kimi 长文本能力领先,支持200 万文字输入;阶跃星辰发布Step 系列通用大模型,包括Step-1V 多模态大模型;百度、阿里等大厂也跟进长文本能力的升级。商业化方面,2B 以api 接口、私有化部署等方式,2C 以订阅制为主,随着用户规模和用户粘性的提升,商业化节奏也有望推进。随着大模型的竞争加剧,优质语料数据的价值凸显。以中文在线为例,公司拥有优质内容数据超60TB,已跟多家模型公司签署协议,合作模式为公司提供版权数据资源用于大模型技术及应用,模型公司验收后进行款项支付。
投资建议:我们认为,(1)国产大模型迭代升级加速,有望看到更多支持政策落地,利好国产大模型的发展。建议关注有大模型布局的公司:百度(文心一言)等。(2)优质语料在大模型训练中的重要性凸显,版权商业化价值在大模型时代将进一步抬升,无论是大语言模型的文字版权内容,还是多模态大模型的图片、视频版权内容等,都有望迎来进一步价值重估。建议关注拥有优质网文/图片/视频版权的公司,其中网文内容关注中文在线、掌阅科技、阅文集团等;出版版权内容关注中国科传、中国出版、新经典、中信出版、读客文化、果麦文化、凤凰传媒、中南传媒等;视频/影视版权内容关注光线传媒、华策影视、上海电影、捷成股份、新媒股份、中广天择、芒果超媒、欢瑞世纪、华数传媒等;图片版权内容关注视觉中国;动漫形象IP 关注汤姆猫、奥飞娱乐、风语筑等。
风险提示:模型迭代效果不及预期、商业化不及预期、内容伦理风险。