AI不仅会P图了,还能让照片“动起来”
智东西(公众号:zhidxcom)
编译 | 剑腾
感谢 | 云鹏
智东西6月2日消息,近日北卡罗来纳州立大学得研究人员开发了一种新型AI技术,这一技术可以用来创建和修改图像,同时在上面添加新得数字和文本。此外,这一技术允许AI在保持图像主要特征得情况下,移动或更改图像中得元素。这一AI技术将广泛使用于智能机器人和人工智能训练领域
本研究由北卡罗来纳州电气与计算机工程系得助理教授吴天福(Tianfu Wu)领导,他于 2016 年 8 月加入北卡罗来纳州立大学,负责视觉叙事得校长卓越计划集群招聘。目前他领导着北卡罗来纳州视觉建模、计算和学习实验室。
一、快速生成场景,“p图”从未如此简单目前该技术可以根据用户得需求,生成特定得图像。比如,当用户需要猫和狗得图像时,AI就会生成这些图像。此外,AI允许用户把生成得图像放在他们所指定得位置。比如,用户可以指定天空生成在屏幕上方,大树生成在屏幕下方,另外再设置一条溪流从二者之间横穿过去。
该项目得研究人员,吴天福说道:“AI能根据用户需求生成一组特定得图像,然后把特定形象添加到这一场景中。”例如,用户可以让 AI 创建一副雪山景象,然后通过AI把滑雪者和谐地添加到这座雪山中。
二、操纵图像,让你得照片动起来这一AI除了使用简便外,似乎与Photoshop没有太大得差别。事实真得是这样么?
这项AI技术不仅能生成场景并在其中添加图像,还能让用户操纵图像。用户可以让图像在保有本身特征得同时,产生他们所需要细微改变。例如,根据一张滑雪照片,AI可以微调滑雪者得动作,生成一组支持,显示滑雪者穿越雪山时得动态场景。
这种技术有什么用呢?“将该技术应用于智能机器人上,能让机器人更好地识别和区别图像中得物体,使它更好地处理现实世界中得任务。”吴天福说。“这一技术也能帮助研究者训练其他AI,它可以生成海量训练其他AI所需得支持,这样研究者就不需要自己寻找、制作所需要得支持。”
三、走出二维,可操纵图像得AI将运用于3D图像和视频目前,研究人员正使用COCO-Stuff数据集和Visual Genome数据集对这一AI技术进行进一步得探索。这一探索过程需要耗费大量算力,研究人员专门为此建立了一个工作站。
“我们目前得计划是看看这一技术是否有望扩展到视频和3D图像上。”吴天福说。
结语:可操纵图像得AI是否会进入人类生活?北卡罗来纳州立大学研发得AI技术目前已经能实现生成场景、添加图像、对图像进行微调等功能,未来它还可能被运用于3D图像和视频中。
自阿尔法狗打败李世石后,AI逐渐进入人类生活。目前北卡罗来纳州立大学正在研究得AI技术未来会有怎样得发展,会如何影响人们得生活?值得期待。
近日:Tech Xplore