百科知识

Meta新模型SAM掀起AI视觉:一键抠图革新CV领域,GPT-3时代的视觉震撼

Meta新模型SAM掀起AI视觉:一键抠图革新CV领域,GPT-3时代的视觉震撼

智东西编译报道

近日,Meta在官方博客上宣布推出一个名为Segment Anything Model(SAM)的AI模型。该模型可实现图像分割功能,识别文本指令等方式中的物体并进行精准分割。据Meta在推特上的公告,该模型的发布象征着计算机视觉领域的重大进步。SAM模型的灵活性被赞誉为行业的标杆,其强大的图像分割能力得益于超过一亿个掩码的大规模数据集训练。英伟达AI研究科学家Jim Fan甚至将其形容为计算机视觉领域的“GPT-3时刻”。Meta还推出了一个名为Segment Anything 1-Billion mask(SA-1B)的图像注释数据集,是目前最大的数据集之一。这一创新在行业内引起了广泛的热议和讨论。

SAM模型具备三种独特的图像切割方式:鼠标停留、手动框选和自动分割。用户无论在上还是在现实场景中,都能找到SAM的免费演示功能。值得称赞的是,SAM还能根据用户的输入提示自动生成多个有效的掩码,精准选中图像中的特定部分。SAM还能与其他系统灵活集成,如在AR/VR环境中通过用户的视线范围选择对象或转换物体状态等。研发团队在论文中详细介绍了SAM的相关细节和训练过程,展示了其在图像识别技术领域的创新程度。交互式标注一个掩码所需的时间只需约14秒,显著提高了图像分割工作的效率。

目前,Meta已经开始使用SAM技术进行照片标记、内容审核以及内容推荐等工作。除了这些实际应用场景外,研发团队还展示了其在VR/AR、智慧农业等领域的应用潜力。文章中还提到了这一技术对内容创作、图像生成等领域的发展具有重要的推动作用,让人们看到了计算机视觉领域的未来发展潜力。随着技术的不断进步和应用场景的不断拓展,相信计算机视觉技术将在更多领域得到应用并推动相关产业的快速发展。与此人们也期待着更多类似的技术创新不断涌现,为人们的生活带来更多便利和智慧。这一重大突破不仅引起了行业的广泛关注,也激发了人们对未来技术发展的无限期待。文章来源:综合自Meta官方博客等报道。


Meta新模型SAM掀起AI视觉:一键抠图革新CV领域,GPT-3时代的视觉震撼

你可能也会喜欢...