发布拓天大模型,面向媒体、金融、政务三大行业6 月29 日,拓尔思正式发布“拓天大模型”,并面向媒体、金融、政务领域,推出了三大行业大模型,凝聚拓尔思在NLP 领域30 年技术创新和积累、10 余年高质量数据和知识资产建设经验,以及在垂直行业10000 多家企业级用户应用实践。拓天大模型拥有内容生成、多轮对话、语义理解、跨模态交互、知识型搜索、逻辑推理、安全合规、数学计算、编程能力和插件扩展十大基础能力,具有中文特性增强的可控生成技术、融合搜索引擎的生成结果可信核查、融合稠密向量的跨模态能力加强以及支持外界知识及时更新四大创新点。目前,拓尔思拓天大模型已经在媒体、政务、金融三个行业取得成果。预计今年下半年,拓尔思还将陆续推出网络舆情、公安、知识产权、法律、审计等五个行业大模型。
探索 AIGC,从降本增效到额外价值转移
拓尔思是国内最早研发人工智能技术的企业之一,拥有二十多年的NLP 研发经验,在NLP、知识图谱、OCR 图像视频结构化等领域都具备自主可控的多模态内容处理底层技术,处于行业领先地位。2022年,公司在人工智能领域开展了6 项重要工作,具体包括预训练大模型和专业模型的融合实践、启动公司自有专业模型trsGPT 研发、开发具有AIGC 能力的虚拟人开放云服务平台、开启生成式大模型创新应用规划、发布了多模态人工智能技术平台、推出了基于事理图谱的事件推演分析系统。在AIGC 相关领域,如机器写作、对话式AI、内容人机协同和自动报告生成等应用场景已相继打造出一批优秀实践案例。
公司积极推进“智创”AIGC 平台的研发。“智创”专注文字自动生成领域,依托公司长期积累的自然语言处理技术和人工智能平台产品为基础,融合开源大模型,专注在辅助型、应用型、创作型等文本内容的自动生成研发,将优先在新闻出版、政务服务、金融领域、通用行业、元宇宙和云服务等领域落地。
深耕数据要素,海量数据叠加丰富应用场景
公司基于自主建设的大数据中心,以长期服务的大量企业、媒体、政府、公安等机构用户的开源数据持续累积为基础,筛选和补充延展并进行有效规范治理,从而建成具有高商业价值的可运营大数据资源,拥有了规模及质量均位列业界前茅的海量丰富、已经过清洗和脱敏的数据资产。公司充分发挥海量数据规模和丰富应用场景优势,在经营过程中形成了一套“1+1=N”的商业模式,即基于自研的大数据底座和人工智能底座,以场景驱动推出N 个行业数据和云服务。
随着数据要素市场发展和改革不断深入,我国数据要素市场进入蓬勃发展阶段,公司将迎来数据要素业务高速增长的黄金发展期。公 司旗下两款产品数星智能风控大数据平台、数家资讯大数据云服务平台已通过深数所合规审查,于今年1 月正式加入其数商生态,为广大用户提供API 接口、数据调用服务。此前,公司以上两款数据产品已入驻北京国际大数据交易所及上海数据交易所。
投资建议
预计公司2023-2025 年的EPS 分别为0.34、0.48、0.60 元,当前股价对应的PE 分别为75.48、54.48、43.57 倍。公司作为语义智能领军者,深耕AIGC 及数据要素市场,具有丰富的数据资源、广泛的用户基础、对适用场景透彻的理解,后续客户落地有望加速。首次覆盖,给予“买入”评级。
风险提示
下游客户需求扩张不及预期;政策推动存在波动性;产品技术研发不及预期;市场竞争加剧。