AI图片编辑神器Anydoor：开启图片编辑的任意门图片主体随意移动

站长网2023-12-21 14:29:340阅

划重点:

🌐由香港大学、阿里巴巴和蚂蚁集团联合研发AnyDoor，通过一张照片将任何物品传送到另一张图片的世界中。

🚪 AnyDoor为图片编辑开启全新时代，实现零样本对象-场景合成。

🎨 设计师无需为合照缺人而烦恼，AnyDoor让贴图穿进背景图，实现自动摆姿势、站位的「魔法」。

随着数字时代图像编辑的飞速发展，来自香港大学、阿里巴巴和蚂蚁集团的新成果AnyDoor为图片编辑开辟了一扇全新的时代之门。

这是一项基于扩散技术的创新，具有将目标物体以和谐的方式传送到用户指定位置的神奇能力。与传统模型需要为每个物体调整参数不同，AnyDoor只需进行一次训练，就能在推断阶段轻松适应多样化的物体-场景组合。

这种具有挑战性的零障碍设置要求对某个对象进行充分的特征描述。为此，在常用的身份特征基础上，补充了细节特征，这些特征经过精心设计，既能保持纹理细节，又能允许多样化的局部变化（如光照、方向、姿势等），使对象能够与不同环境和谐融合。

此外，研究人员还提出从视频数据集中借用知识，从中观察单个对象在时间轴上的各种形态，以增强模型的泛化能力和稳健性。大量实验证明，我们的方法在效果上优于现有替代方案，并在虚拟试穿和物体移动等实际应用中展现出巨大潜力。

AnyDoor能实现的效果包括

1. 物体移动: AnyDoor可应用于高级任务，如物体移动，轻松实现场景中物体的位置变换。

比如把这张图里桌面上的位置任意变化:

2. 物体交换: AnyDoor可扩展为进行物体交换，为图像增添更多创意和趣味。

如下图，可以将图中两辆车的位置对调:

3. 多主体合成: 由于AnyDoor对于将物体放置在给定场景特定位置具有高度可控性，因此轻松扩展为多主体合成，创造更加丰富的画面。

比如把下图中所有的宠物狗都放到同一个草地上:

4. 虚拟试穿: AnyDoor可作为虚拟试穿的简单但强大基线。无需复杂的人体解析，能够保留不同衣物的颜色、图案和纹理。试穿衣服也能玩成贴画游戏版本，图中人物换上想要的衣服

这项技术创新为图像编辑领域带来了新的可能性，将在图像合成、效果图像渲染、海报制作、虚拟试穿等多个应用场景中发挥实际作用。

项目网址:https://damo-vilab.github.io/AnyDoor-Page/

论文网址:https://arxiv.org/pdf/2307.09481.pdf

0000

评论列表

共(0)条

AI图片编辑神器Anydoor：开启图片编辑的任意门 图片主体随意移动