
编译 | 剑腾
编辑 | 晓风
这项创新研究的领头人是北卡罗来纳州电气与计算机工程系的助理教授吴天福,他于2016年加盟该校,并致力于视觉叙事领域的卓越计划。目前,他领导着北卡罗来纳州的视觉建模、计算与学习实验室。
一、AI图像生成:打造个性化场景,“P图”进入新纪元
该AI技术能够根据用户的需求快速生成特定图像。无论是猫的图像还是狗的图像,只需简单操作,AI即可生成。不仅如此,用户还可以指定图像的位置,如让天空出现在屏幕上方,大树位于屏幕下方,甚至再添加一条溪流穿越其间。
吴天福教授表示:“AI不仅能够生成特定场景,还能将特定形象融入其中。”比如用户可以要求AI创建一个雪山场景,然后轻松地将滑雪者形象融入到场景中。
二、图像微调:动态照片触手可及
除了简便的使用体验,这项AI技术与Photoshop相比有着更多独特之处。它不仅能生成场景并添加图像,还允许用户对图像进行微调。在保持图像本身特征的用户可以细微调整图像,如根据滑雪照片调整滑雪者的动作,生成动态的滑雪场景。
吴天福教授进一步指出:“将该技术应用于智能机器人,可提升机器人识别和处理图像的能力,使其更好地完成现实任务。”该技术还能助力研究者训练其他AI,生成大量所需的训练图片,节省寻找和制作图片的时间。
三、迈向三维:AI技术在3D图像和视频中的应用探索
目前,研究人员正利用COCO-Stuff和Visual Genome数据集对AI技术进行更深入的探索,为此专门建立了工作站。吴天福教授透露:“我们的计划是探索这一技术在视频和3D图像上的潜力。”
结语:AI技术走进生活的新篇章
北卡罗来纳州立大学研发的AI技术已具备生成场景、添加和调整图像等功能,未来还有可能应用于3D图像和视频。自阿尔法狗战胜李世石以来,AI技术逐渐融入人类生活。期待北卡罗来纳州立大学的研究成果能在未来为人们的生活带来更多便利和乐趣。
来源:科技新视野。
