4 月5 日,Meta 发布机器视觉领域首个用于图像分割的通用大模型Segment Anything Model(SAM)及其训练数据集Segment Anything 1-Billion(SA-1B),并将该模型及数据集在GitHub 上开源,以促进机器视觉通用基础大模型的进一步研究。
国信传媒观点:1)SAM 是计算机视觉领域发布第一个用于图像分割的、可通过提示(prompt)方式应用的通用大模型,类似自然语言领域(NLP)中的大模型ChatGPT;2)从模型框架上看,该模型和NLP 领域大模型一样采用Transformer 架构,该模型及其数据集开源发布将会大幅促进机器视觉通用基础大模型的进一步研究。SAM 可以与NLP 方向的大模型一同成为更大AI 系统的组成部分,理解网页的视觉和文本内容,并对世界进行多模态的理解与生成;3)从应用场景上来看,SAM 可用于帮助需要在任何图像中查找和分割对象的众多领域中的应用程序;对于内容创作者,SAM 可以改进创意应用,例如提取图像区域以进行拼贴或视频编辑;在AR/VR 领域,SAM 可以根据用户的视线选择对象,然后将其“提升”为3D 等等;我们认为,从ChatGPT 到SAM、从文本到视觉,大模型技术有望实现从单一模态到多模态的加速推进。从文本生成到图像、视频、游戏、VR/AR 内容及平台有望迎来基于新科技“降本增效”所带来的奇点时刻,IP、内容(影视、游戏、文学等)、数据资源价值有望持续重估放大:1)持续推荐AIGC 时代具备稀缺性或者价值放大可能的关键产业链环节,推荐大模型、IP、数据要素及稀缺场景,大模型推荐昆仑万维,IP推荐中文在线、视觉中国、上海电影、汤姆猫、奥飞娱乐、华策影视、光线传媒等标的,数据要素推荐浙数文化、中国科传、新华网、人民网以及出版板块,场景落地关注AI+文学、音乐、数字人、营销服务、电商、视频、游戏等领域;2)持续看好估值处于合理区间的游戏板块(推荐恺英网络、姚记科技、三七互娱、吉比特、世纪华通等标的)以及广告/影视产业链个股(芒果超媒、光线传媒、哔哩哔哩等标的)。
风险提示:监管政策风险;业绩风险;商誉及资产减值风险等。
评论:
Meta 发布并开源图像分割基础大模型SAM
4 月5 日,Meta 发布机器视觉领域首个用于图像分割的通用大模型Segment Anything Model(SAM)及其训练数据集Segment Anything 1-Billion(SA-1B),并将该模型及数据集在GitHub 上开源,以促进机器视觉通用基础大模型的进一步研究。