6 月21 日,Anthropic 发布了Claude3.5 系列第一款产品Claude 3.5 Sonnet。
Claude 3.5 Sonnet 在性能方面对比Claude 3 Opus 全面升级,并在多个模型指标中超越GPT-4o。Claude 3.5 Sonnet 在运行速度方面是 Claude 3 Opus 的两倍,成本仅为其五分之一,且定价与之相同皆为每百万输入token 收费 $3,每百万输出token 收费 $15 ,并具有 200K 令牌上下文窗口。
Claude 3.5 Sonnet 在基准测试中表现优异,多方面力压GPT-4o。Claude 3.5Sonnet 在性能上对比Claude 3 系列有巨大提升,并为研究生水平推理(GPQA)、本科生水平知识(MMLU)、编码能力(HumanEval)等设定了全新的行业基准。
Claude 3 Sonnet 在捕捉微妙差异、展现幽默以及执行复杂指令方面获得显著提升,可输出流畅自然且亲切的高质量内容,为目前最具人性且最强性能的AI 模型。同时,Claude 3.5 Sonnet 在内部编码评估中展示惊人能力,可解决64%的问题,对比过去产品Claude 3 Opus 可解决38%问题有较大提升。
Claude 3.5 Sonnet 为目前最强大的视觉模型。Claude 3.5 Sonnet 在视觉能力各方面表现最为优异,在多模态任务评估中仅一项略逊于GPT-4o,其余各项如视觉数学推理、科学图解、图表问答和文档可视化问答皆力压其他模型。其视觉推理任务能力表现最为优异,如解释图表等,可帮助使用者从一个具有瑕疵的图像中转录文本,也可从图形、图像和插图等方面为使用者提供更多见解内容。
Claude 3.5 Sonnet 推出全新功能Artifacts。Artifacts 拓展功能是用户与Caude 的一种互动交互方式,该功能为用户提供一个可视化专用窗口。当用户要求Claude3.5 Sonnet 生成代码、网页设计等方面时,其会为用户提供动态工作区,用户可以实时查看、编辑并完成Claude 创作内容。Claude 的这一预览功能象征着它从单纯的对话式人工智能跃升为一个协作式的工作环境,未来将为团队、组织赋能,为其提供安全的共享中心以整合他们的知识、文档与工作内容。
我们认为, Anthropic 推出Claude 3.5 Sonnet 有望加速AI 相关应用落地,同时对于算力的需求也会随之大幅提升。
AI 应用:建议关注中科创达(300496,买入)、虹软科技(688088,未评级)、金山办公(688111,增持)、泛微网络(603039,买入)、新致软件(688590,未评级)、彩讯股份(300634,买入)、科大讯飞(002230,买入)、万兴科技(300624,未评级)等公司
AI 算力:建议关注云赛智联(600602,未评级)、中科曙光(603019,买入)、海光信息(688041,买入)、寒武纪-U(688256,未评级)、润泽科技(300442,未评级)、华铁应急(603300,买入)等公司
其他工具:星环科技-U(688031,未评级)
风险提示
技术落地不及预期;政策监管风险