首页站长资讯当韩国女团BLACKPINK进军二次元，清华叉院AI神器原来还能这么玩

当韩国女团BLACKPINK进军二次元，清华叉院AI神器原来还能这么玩

站长网2023-11-17 09:08:441阅

如果你手机里有一些修图软件，你可能用过里面的「AI 绘画」功能，它通常会提供一些把照片转换为不同风格的选项，比如动漫风格、写真风格。但如今，视频也可以这么做了:

这些动图来自 X 平台（原推特）网友 @CoffeeVectors 生成的一段视频。他把韩国女团 BLACKPINK 代表作《DDU-DU DDU-DU》的原版 MV 输入了一个 AI 工具，很快就得到了动漫版的 MV。

这个视频是借助一个名叫 ComfyUI 的工具来完成的。ComfyUI 是一个开源的基于图形界面的 Workflow 可视化引擎，用于被广泛采用的文生图 AI 模型 Stable Diffusion。它提供了一个用户友好的图形界面，可以将多个 Stable Diffusion 模型及其 Hypernetwork 组合成一个完整的工作流（Workflow）实现自动化的图像生成和优化。同时，社区也开发了各种 ComfyUI 的扩展插件，可以进一步增强其功能。

作者 @CoffeeVectors 表示，在制作这个 MV 的过程时，他在 ComfyUI 中用到了 AnimateDiff 和 multi-controlnet 工作流，前者用于动漫风格的生成，后者用来实现生成效果的控制。更重要的是，他在这次工作流中引入了一个当下很火的神器 ——LCM LoRA。

在《实时文生图速度提升5-10倍，清华 LCM/LCM-LoRA 爆火，浏览超百万、下载超20万》一文中，我们已经介绍过，LCM 是清华大学交叉信息研究院的研究者们构建的一个新模型，它的特点是文生图、图生图的效果都非常快，可以根据你的文字指令或草图指示实时生成新图。

在此基础上，研究者们又进一步开发了 LCM-LoRA，可以将 LCM 的快速生成能力在未经任何额外训练的情况下迁移到其他 LoRA 模型上。由于效果非常惊艳，模型在 Hugging Face 平台上的下载量已超20万次，X 平台上到处都能看到利用 LCM-LoRA 生成的实时视频效果（如下方的视频所示）。

机器之心机动组，赞90

那么，这个动漫版的 MV 是怎么做的呢?@CoffeeVectors 在帖子中详细描述了他的做法。