3 月5 日凌晨,主要由谷歌、亚马逊投资的Anthropic 公司推出了三款新的AI 模型,按智能水平和成本由低到高依次为Claude 3 Haiku、Claude 3Sonnet 和Claude 3 Opus。
性能显著提升,模型性能超越GPT-4
①Claude 3 每款模型各具特色:其中Opus 性能领衔三者,在Anthropic 放出的测试结果中,MMLU、GPQA、GSM8K 等8 项测试得分均力压GPT-4,展现出接近人类的理解和流畅性;Sonnet 作为中间选择,巧妙地平衡了处理速度和计算效率,同时兼顾经济性,在需要大规模部署的企业级应用场景中具有优势;而Haiku 是三者中最快、体积最小的模型,对于arXiv 网站上一篇信息和数据密度很高的论文(约1 万token),Haiku 仅需3 秒就能读取。
②对比来看,Claude 3 Opus 模型性能完全胜过GPT-4,以及Gemini 1.0Ultra。Claude 3 Sonnet 在部分基准上,比如GSM8K 等超越了GPT-4。Claude3 Haiku 可以与Gemini 1.0 Pro 相抗衡。这让我们看到大模型迭代的速度,持续在性能上有突破,同时我们认为这也更加令人期待后续GPT-5 的动态以及其性能的提升。
③Claude 3 模型的指令遵循能力大幅度提升,拒绝回答接近系统护栏的提示的可能性明显降低,对请求表现出更细致的理解,能够识别真正的违反内容政策的问题,并且拒绝回答无害提示的频率显著下降。
④在减少模型“幻觉”即提供错误的信息输出方面,Claude 3 Opus 能够超越GPT-4 Turbo。相较于 Claude 2.1,Claude 3 Opus 在给出正确答案和减少错误答案方面的表现提升了两倍。
⑤Claude 3 模型家族提供了200K 的上下文窗口,并且能够处理超过100 万token 的输入,有助于更好地理解和记忆长文本信息。
多模态处理能力先进,c 端实用性升级;专业领域性能飙升,b 端适用性领跑
Claude 3 具有与其他同业的领先型号相当的复杂视觉功能。可以处理包括照片、图表、图形和技术图表等在内的视觉格式,具有增强的视觉能力,类似于 GPT-4V 和谷歌的 Gemini。目前开放给企业客户多模态功能,其中一些客户高达 50% 的知识库以各种格式编码,例如 PDF、流程图或演示幻灯片。
同时,Claude 3 发布了在金融、医学和哲学等特定领域的专家基准测试的性能表现,相比Claude 2.1 等早期版本均有了显著进步。
AI 模型进展不断百花齐放,持续看好AI 算力核心标的AI 近期进展不断。海外方面,多模态持续催化,Sora、Stable Diffusion 3,包括谷歌世界模型Genie 陆续推出,AI 模型进展百花齐放。我们认为多模态模型的持续演进以及对于AI 模型持续的迭代升级,而算力作为AI 模型的基础底座,在AI 模型争锋下有望带动算力军备竞赛,算力需求有望持续火热,重视AI 硬科技核心受益标的,如光模块、服务器交换机迭代升级有望进一步加快。同时积极期待AI 应用的发展到落地,持续重视AI 方向核心受益品种。
投资建议:①光模块&光器件:中际旭创、天孚通信、新易盛、源杰科技(电子组联合覆盖)、博创科技、仕佳光子等;②服务器交换机及PCB:沪电股份(电子组联合覆盖)、中兴通讯、紫光股份(计算机组联合覆盖)等;③智算:润泽科技(机械组联合覆盖)、润建股份等。
风险提示:AI 进展低于预期,算力建设不及预期,竞争加剧的风险